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本 书 详细 讲解 如 何 使 用 ML 语言 进行 程序 设计 ， 并 介绍 函数 式 程序 设计 的 基本 原理 。 
书 中 特别 讲述 了 为 ML 的 修订 版 所 设计 的 新 标准 库 的 主要 特性 ， 并 且 给 出 大 量 例 子 , 涵盖 
排序 、 和 矩阵 运算 、 多 项 式 运 算 等 方面 。 大 型 的 例子 包括 一 个 一 般 性 的 自 顶 向 下 语法 分 析 
器 、 一 个 入 -演算 归 约 程序 和 一 个 定理 证 明 机 。 书 中 也 讲述 了 关于 数组 、 队 列 、 优 先 队 列 
等 高 效 的 函数 式 实现 ， 并 且 有 一 章 专 门 讨论 函数 式 程序 的 形式 论证 。 

本 书 可 作为 高 等 院 校 计算 机 专业 相关 课程 的 教材 ， 也 适合 广大 程序 设计 人 员 参 考 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 芍 断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 秦 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 更 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 村 选 出 Tanenbaum Stroustrup, Kernighan, 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 上 刻 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 训 助 ， 国 内 的 专家 不 仅 提供 了 中 
上 背 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 从 书 ” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” RIAR 
“全 美 经 典 学 习 指导 系列 "”。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮 电大 学 、 中 出 大学、 解放军 理 工大 学 、 郑 州 大 学 、 湖 
北 工学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
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的 著名 学 者 组 成 “专家 指导 委员 会 ， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 

这 三 套 丛书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I.T.，Stanford ，U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 有 具 特色 一 -有 的 出 自 语 言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 误 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫 绒 中 由 登 党 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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译 者 F 


多 年 前 我 曾经 认为 自己 是 一 个 程序 员 ， 对 程序 设计 有 着 执著 的 兴趣 。 试 图 洞悉 本 质 的 渴 
望 以 及 相关 知识 的 匮 乏 往 往 令 我 陷 人 苦 思 。 于 是 我 开始 了 新 一 轮 的 阅读 。 在 一 个 图 书馆 中 书 
架 林 立 的 某 处， 我 发 现 了 这 本 写 给 程序 员 的 书 。 在 我 相对 贫乏 的 阅读 历史 中 ， 书 名 带 有 “ 程 
EBR (programmer) 的 窗 窗 无 几 ， 又 怎 能 不 留意 呢 ? 这 本 书 最 终 没 有 让 我 失望 。 

如 果 说 过 去 我 对 程序 设计 有 过 一 些 有 意义 的 思考 ， 而 从 中 得 到 了 乐趣 的 话 ， 函 数 式 程序 
设计 则 系统 地 叙述 了 这 些 令 人 兴奋 的 闪光 之 处 。 这 种 基于 某 种 数学 概念 的 方法 把 我 们 从 程序 
运行 的 细节 中 解放 出 来 ， 转 而 关注 如 何 去 表 达 。 程 序 因此 变 成 一 个 个 静态 的 方程 式 ， 安 详 地 
躺 在 那里 ， 展 示 着 简单 而 丰富 的 内 涵 。 我 们 则 不 再 被 传统 的 动态 步骤 困扰 ， 思 想 在 清晰 的 、 
静态 的 表达 基础 上 轻松 地 延伸 着 ， 这 是 多 么 美妙 的 感受 啊 ! 我 们 曾经 认为 ， 如 果 无 法 理解 赋 
值 语句 就 不 能 进行 程序 设计 ， 我 们 费 了 多 少 力 气 去 习惯 它 ， 以 至 于 后 来 已 完全 在 脑海 中 根 座 
蒂 因 了。 现在 我 们 要 从 这 种 被 扭曲 的 思维 中 走出 来 ， 回 到 更 为 自然 的 思考 方式 去 ， 而 贸 数 式 
程序 设计 则 是 众多 方法 中 的 一 个 。 

ML 语言 是 函数 式 语言 中 较为 经 典 的 ， 它 的 语法 简单 优美 ,语义 清晰 准确 并 易于 理解 ， 语 
言 的 实现 也 相当 高 效 和 严谨 。 和 最 新 式 的 函数 式 语言 不 同 ，ML 辆 牲 了 一 些 数学 上 的 纯粹 性 ， 
换 来 了 相对 简单 的 语义 描述 ， 理 解 它 不 需要 十 分 高 深 的 数学 抽象 思考 。 这 对 于 语言 的 实用 性 
是 十 分 重要 的 。 正 如 书 中 所 说 ， 我 们 不 希望 从 机 器 语言 繁琐 的 运行 步骤 中 走出 来 ， 而 立即 又 
掉 进 同样 复杂 繁琐 的 数学 模型 中 去 。 作 为 一 种 入 门 的 函数 式 程序 设计 语言 ，ML 不 仅 对 于 初学 
程序 设计 的 学 生 是 一 个 好 的 语言 ， 对 于 有 经 验 的 程序 员 来 说 也 是 一 个 好 的 桥梁 ， 程 序 员 们 将 
或 多 或 少 地 发 现 ， 他 们 过 去 的 一 些 思考 竟 有 如 此 简单 的 归宿 。 我 想 ， 这 也 是 原 书 命名 的 由 来 。 

原 书 是 一 本 非常 流行 的 ML 语言 和 函数 式 程序 设计 教材 ， 尽 管 第 2 版 面世 至 今 已 有 很 长 时 间 
了 ， 但 依旧 被 国外 许多 大 学 的 相关 科目 广泛 采用 。 书 中 在 介绍 ML 语言 的 同时 更 多 地 阐述 了 语 
言 和 函数 式 程序 设计 的 思考 方法 。 大 量 的 例子 条 理 分 明 ， 深 浅 搭配 适度 。 随 处 可 见 的 精心 安排 
的 旁白 涉及 了 计算 机 语言 理论 研究 的 许多 方面 ， 作 为 科普 读物 来 说 也 非常 赏心悦目 。 我 很 喜欢 
这 本 书 ， 衷 心地 希望 能 将 之 介绍 给 更 多 的 中 国 读 者 。 我 的 翻译 工作 是 认真 而 仔细 的 ， 然 而 由 于 
水 平 有 限 ， 令 人 遗憾 之 处 恐 在 所 难免 ， 希 望 读者 不 要 因此 受阻 ， 能 在 阅读 中 有 所 收获 。 

我 感谢 机 械 工业 出 版 社 ， 她 们 出 版 了 许多 计算 机 基础 理论 的 译 著 ， 这 一 本 也 不 例外 。 我 
囊 心 希望 此 举 能 将 计算 机 不 仅 作为 一 种 技术 ， 也 作为 一 种 科学 推广 ,产生 更 多 的 思想 积淀， 
形成 更 广泛 的 基础 。 我 还 要 感谢 在 此 书 翻译 过 程 中 给 我 宝贵 指点 和 帮助 的 各 位 尊敬 的 老师 和 
” 编辑 们 。 原 书 的 作者 Paulson 博 士 也 对 我 的 提问 作出 了 耐心 的 讲解 。 
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每 次 重新 印刷 ， 书 中 的 一 些小 错误 都 会 悄悄 地 消失 。 但 是 重新 印刷 并 不 会 做 大 的 改进 ， 
尽管 改进 是 很 有 意义 的 。 因 为 这 样 做 会 影响 页 码 编 号 ， 使 内 容 产生 差别 而 互 不 兼容 。 重 大 的 
改动 积累 起 来 (以 及 编辑 的 催促 ) 便 产 生 了 这 个 第 2 版 。 

非常 幸运 的 是 ， 对 ML 语言 的 改动 都 次 到 了 一 起 。ML 有 了 新 的 标准 库 ， 并 且 语 言 本 身 也 
经 过 了 修订 。 值 得 强调 的 是 ， 这 些 改动 没有 四 牧 ML 固 有 的 可 靠 性 。 一 些 降 泌 的 技术 要 点 已 经 
得 到 简化 ， 原 先 定义 中 不 合适 的 地 方 也 改正 了 。 现 有 的 程序 几乎 不 用 改动 就 可 以 继续 运行 。 
最 明显 的 改动 是 增加 了 新 的 字符 类 型 ， 还 有 一 套 新 的 顶层 库 图 数 。 

这 版 新 书 及 时 反映 了 语言 的 变化 ， 并 在 格局 安排 上 做 了 很 大 的 改进 。 模 块 提前 到 第 2 章 就 
介绍 了 ， 而 不 是 放 到 第 7 章 ， 它 的 使 用 贯穿 全 书 。 这 使 得 重点 有 所 转移 ， 从 数据 结构 《比如 二 
又 搜索 树 ) 变 为 抽象 类 型 【比如 字典 )。 抽 象 类 型 通常 在 某 一 小 节 引 入 ， 并 给 出 它 的 ML 签名 。 
然后 讲解 实现 背后 的 思想 ， 最 后 给 出 ML 结构 的 代码 。 虽 然 评 审 对 第 1 版 较为 宽容 ， 但 是 许多 
读者 要 求 重新 组 织 内 容 。 

书 中 的 程序 不 仅 移动 了 位 置 ， 而 且 重新 编写 过 。 它 们 反映 了 如 何 使 用 模块 的 新 思路 。 由 
于 open 声 明 会 隐藏 模块 结构 ， 所 以 已 经 很 少 出现 了 。 国 子 也 仅 在 需要 的 时 候 才 使 用 。 现 在 ， 
程序 的 缩 进 也 排 得 很 仔细 了， 加 上 其 他 改进 ， 代 码 变 得 更 加 易 读 ， 质 量 也 更 好 了 ， 表 现在 合 
并 排序 更 为 简单 迅速 ， 优 先 队列 也 更 快 了 。 

新 标准 库 也 要 求 尽早 地 提 到 模块 。 尽 管 这 样 做 就 必须 修改 现 有 代码 ， 但 它 能 使 ML 在 现实 
语言 中 的 地 位 更 加 稳固 。 新 标准 库 的 设计 经 过 了 漫长 的 磋商 过 程 ， 主 要 是 为 了 提供 全 面 的 支 
持 ， 同 时 避免 过 分 的 复杂 化 。 它 的 组 织 显示 了 ML 模块 的 优点 。 字 符 串 处 理 、 输 入 输出 和 系统 
接口 这 些 模块 都 提供 了 实际 的 功能 改进 。 

新 标准 库 导 致 很 多 代码 必须 重 写 。 当 新 标准 库 包 含 函数 foldl 时 ， 读 者 一 般 不 愿意 再 看 到 
以 前 类 似 的 函数 foldieft。 但 是 这 些 函 数 不 是 完全 一 样 的 ， 所 以 ， 重 写 并 不 只 是 改 个 名 字 那 么 
简单 。 很 多 曾 讲述 实用 函数 的 章节 ,现在 都 要 对 照 新 标准 结构 进行 检查 更 新 。 

更 新 过 的 参考 文献 说 明了 函数 式 程序 设计 和 ML 在 各 领域 的 广泛 应 用 。MEL 符 合 构建 可 靠 
系统 的 要 求 。 软 件 工程 师 们 需要 一 种 能 提供 类 型 安全 、 模 块 化 、 编 译 时 一 致 性 检测 和 容错 
(异常 ) 的 语言 。ML 程 序 是 可 移植 的 ， 这 要 部 分 归功 于 标准 库 。 商 业 化 的 编译 器 正在 不 断 提 
高 质量 和 效率 。ML 的 运行 速度 可 以 和 C 媲 美 ， 特 别 是 在 需要 复杂 存储 管理 的 应 用 场合 。 本 书 
WAL ( 指 英文 书 名 ) 曾 引 来 一 些 嘲笑 ,但 却 给 出 了 很 好 的 提示 。 

我 最 惊讶 的 是 看 到 第 1 版 出 现在 初级 程序 员 的 手中 , 尽管 第 一 页 上 写 着 让 他 们 看 点 别 的 书 。 
为 了 帮助 初学 者 ， 我 加 入 了 一 些 特别 简单 的 例子 ， 并 将 大 多 数 参考 引用 从 正文 中 移 走 。 重 写 
了 第 1 章 ， 试 图 以 一 种 既 适 合 初学 者 又 适合 有 经 验 的 C 程 序 员 的 方式 介绍 基本 的 程序 设计 概念 。 
这 比 听 上 去 要 容易 : C 并 不 想 给 程序 员 一 个 解决 问题 的 环境 , 而 仅仅 是 给 底层 的 硬件 稍 加 装扮 。 
第 1 章 仍旧 包含 一 些 基本 的 计算 机 常识 ， 但 教师 也 许 还 是 喜欢 从 第 2 章 开 始 讲述 ， 因 为 它 带 有 
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简单 的 会 话 过 程 。 

在 书 的 末尾 列 出 了 一 些 项 目 建议 。 我 故意 说 得 不 很 明确 ， 因 为 一 个 大 项 目的 第 一 步 就 是 
准确 地 分 析 需 求 。 我 希望 看 到 越 来 越 多 的 人 在 项 目 中 采用 ML， 选 择 ML， 特 别 是 取代 像 C 这 样 
不 安全 的 语言 ， 最 终 会 被 看 作 是 专业 的 一 种 标志 。 

我 非常 感谢 所 有 对 这 一 版 给 出 有 用 的 意见 、 建 议 或 代码 的 人 们 。 他 们 分 别 是 Matthew 
Arcus, Jon Fairbairn, Andy Gordon, Carl Gunter, Michael Hansen, Andrew Kennedy, 
David MacQueen, Brian Monahan, Arthur Norman, Chris Okasaki, John Reppy. Hans 
Rischel, Peter Sestoft, Mark Staples 和 Mads Tofte 。Sestoft 还 给 了 我 一 个 Moscow ML 的 预 发 行 


版 含有 库 的 更 新 。CUP 的 Alison Woollatt 编 写 了 BEX 的 类 文件 。Franklin Chen 和 Namhyun 
Hur 报 告 了 前 一 版 中 的 错误 。 
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本 书 源 于 对 Standard ML 和 消 数 式 程序 设计 的 讲稿 。 它 仍 可 以 作为 函数 式 程序 设计 的 课 
本 一 一 一 本 面向 实用 ， 而 不 是 标准 的 、 理 想 化 的 书 然而 ， 它 主要 是 一 本 有 效 使 用 ML 的 指 
南 。 它 甚至 讨论 了 ML 的 命令 式 特性 。 

有 些 内 容 需 要 离散 数学 的 知识 ， 例 如 初等 逻辑 和 集合 论 。 读 者 会 发 现 以 往 的 程序 设计 经 
仿 是 有 用 的 ， 但 不 是 必需 的 。 

本 书 是 一 本 程序 设计 手册 ， 而 不 是 参考 手册 。 它 覆盖 了 ML 的 主要 方面 ， 但 并 不 尽 述 所 有 
的 细节 。 它 在 理论 原理 上 花费 了 一 些 篇 幅 ， 但 主要 还 是 关心 高 效 的 算法 和 实际 的 程序 设计 。 

本 书 的 组 织 反映 了 我 的 教学 经 验 。 高 阶 函 数 出 现 得 较 晚 ， 在 第 5 章 讲述 。 惯 常 的 做 法 是 在 
一 开始 就 介绍 一 些 不 其 自然 的 例子 ， 这 样 做 只 能 使 学 生 们 感到 困惑 。 高 阶 函 数 的 概念 是 不 容 
易 理 解 的 ， 需 要 充分 的 预备 知识 。 所 以 ， 本 书 从 基本 类 型 、 表 和 树 开始 讲述 。 当 讲 到 高 阶 函 
数 时 ， 很 多 相关 的 例子 已 经 是 现成 的 了 。 

练习 的 难度 相差 很 大 。 它 们 不 是 用 来 评测 学 生 的 ， 而 是 为 了 提供 实践 机 会 ， 拓 展 内 容 和 
激发 讨论 的 。 

本 书 一 览 。 大 多 数 章 节 都 专注 于 ML 的 各 个 方面 。 第 1 章 介 绍 了 函数 式 程序 设计 的 背景 思 
想 ， 以 及 ML 的 历史 概况 。 第 2 ~ 5 童 涵盖 了 ML 的 销 数 式 部 分 ， 包 括 对 模块 的 简介 。 讲 述 了 基 
本 类 型 、 表 、 树 和 高 阶 函 数 。 对 函数 式 程序 设计 的 更 广泛 的 原理 也 有 所 讨论 。 

第 6 章 给 出 了 论证 函数 式 程序 的 形式 方法 。 看 上 去 似乎 偏离 了 程序 设计 的 主题 ， 然 而 错误 
的 程序 是 没 用 的 。 易 于 形式 论证 是 函数 式 程序 设计 的 一 大 好 处 。 

第 7 章 详 细 讲 述 了 模块 ， 包 括 函 子 ( 带 参数 的 模块 )。 第 8 章 讲 述 了 ML 的 命令 式 特性 : 引 
用 、 数 组 和 输入 输出 。 本 书 的 其 余部 分 由 较 大 的 例子 构成 。 第 9 章 给 出 了 函数 式 的 语法 分 析 器 
和 一 个 入 -演算 解释 器 。 第 10 章 给 出 了 一 个 定理 证 明 机 ， 这 是 ML 的 传统 应 用 。 

书 中 的 例子 非常 丰富 。 其 中 一 些 只 是 为 了 说 明 ML 的 某 个 方面 ， 但 大 多 数 本 身 就 有 一 定 用 
途 一 一 排序 、 国 数 式 数 组 、 优 先 队 列 、 搜 索 算 法 、 美 化 打印 。 请 注意 : 虽然 我 测试 过 这 些 程 
FF, 但 是 它们 仍 不 免 含 有 错误 。 

信息 和 警告 块 。 技 术 性 的 旁白 、 库 函数 的 叙述 以 及 为 进一步 学 习 而 给 出 的 笔记 都 会 不 时 
地 出 现 。 它 们 被 加 以 如 下 图 标 以 便 有 些 读者 可 以 跳 过 : 

O 亨利 王 的 要 求 。 他 们 拿 不 出 什么 理由 可 以 反对 陛下 向 法 兰 西 提出 王位 的 要 求 ， 

只 除了 这 一 点 ， 那 个 在 法 拉 莹 时代 制定 的 一 条 法 律 ，In terram Salicam mulieres ne 

succedant, “在 搬 利 族 的 土地 上 妇女 没有 继承 权 `: 而 法 国人 就 把 这 “ 搬 利 族 的 土地 ” 

曲解 为 法 兰 西 的 土地 ， 并 且 把 法 拉 蒙 认 做 是 这 条 法 律 的 创制 人 和 妇 权 的 剥夺 者 。 可 

是 他 们 的 历史 学 家 却 忠 实地 宣称 搬 利 区 是 在 日 耳 要 的 土地 上 -.………: e 





号” 节 中 的 技术 性 旁白 不 会 像 这 位 大 主教 的 演讲 那么 长 ， 它 有 62 行 。 
(是 段 译 文 分 别 出 自 莎士比亚 《 享 利 五 世 》 和 《 理 查 三 世 》 中 译本 。 一 一 译 者 注 ) 





ML 并 不 完美 。 某 些 缺 陷 会 使 简单 的 编码 错误 浪费 掉 程 序 员 几 个 小 时 的 时 间 。 而 且 ， 新 的 
标准 库 使 得 新 旧 编 译 器 不 兼容 。 因 此 ， 本 书 中 有 一 些 这 样 的 警告 图 标 : 


A PS BFIRHAR. T, HER! 小 心 那 个 狗 东 西 : Seo, AMMAR 
人 ; 咬 了 人 ， 它 的 牙 毒 还 会 叫 你 痛 极 而 死 ; RAKE, FORE, 罪恶 、 死 亡 和 
WRAP TR, WES KALE RA ER, 


我 要 赶紧 补充 一 点 ， 在 ML 里 不 会 产生 这 么 可 怕 的 后 果 。 程 序 里 的 错误 是 不 能 冲垮 ML 系 
统 本 身 的 。 另 一 方面 ， 程 序 员 必 须 牢 记 ， 即 使 是 正确 的 程序 也 可 能 给 外 部 世界 带 来 伤害 。 

如 何 得 到 Standard ML 编译 器 。 由 于 Standard ML 刚 出 现 不 久 ， 很 多 学 院 没 有 编译 器 。 下 
面 列 出 了 现 有 的 一 些 Standard ML 编译 器 ， 并 附 有 联系 地 址 。 书 中 的 例子 是 在 Moscow ML, 
Poly/ML 和 Standard ML of New Jersey 下 开发 的 。 我 尚未 尝试 其 他 的 编译 器 。 

要 得 到 MLWorks， 请 联系 Harlequin Limited, Barrington Hall, Barrington, Cambridge, CB2 
SRG, England。 他 们 的 电子 邮件 地 址 是 web@harlequin.com。 

要 得 到 Moscow ML ， 请 联系 Peter Sestoft, Mathematical Section, Royal Veterinary and 
Agricultural University, Thorvaldsensvej 40, DK-1871 Frederiksberg C, Denmark。 或 从 互联 网 
上 得 到 该 系统 : 

http:/www.dina.kvl.dk/~sestoft/mosml.html 


要 得 到 Poly/ML ， 请 联系 Abstract Hardware Ltd, 1 Brunel Science Park, Kingston Lane, 
Uxbridge, Middlesex, UB8 3PQ, England。 他 们 的 电子 邮件 地 址 是 lambda@ahl.co.uk。 或 从 互 
联网 上 得 到 该 系统 ”: 

http://www.polyml.org/ 


要 得 到 Poplog Standard ML ， 请 联系 Integral Solutions Ltd, Berk House, Basing View, 
Basingstoke, Hampshire RG21 4RG, England。 他 们 的 电子 邮件 地 址 是 isl&isl.co.uk。 

要 得 到 Standard ML of New Jersey， 请 联系 Andrew Appel, Computer Science Department， 
Princeton University, Princeton NJ 08544-2087, USA。 更 好 的 是 可 以 从 互联 网 上 得 到 文件 3: 

http://www.cs.princeton.edu/~appel/smlnj/ 

http://www.smlnj.org/ 

书 中 的 程序 和 一 些 练习 答案 可 以 通过 电子 邮件 得 和 到， 我 的 电子 邮件 地 址 是 
lcp@cl.cam.ac.uk。 如 果 可 能 ， 请 使 用 互联 网 ， 我 的 主页 在 


http://www.cl.cam.ac.uk/users/lcp/ 


致谢 。 编 辑 ，David Tranah ， 在 写作 的 各 个 阶段 提供 了 帮助 HAM SHA. Graham 
Birtwistle, Glenn Bruns 和 David Wolfram 仔 细 了 阅读 了 文本 。Dave Berry, Simon Finn, Mike 
Fourman, Kent Karlsson, Robin Milner. Richard O'Keefe, Keith van Rijsbergen. Nick 
Rothwell, Mads Tofte, David N. Turner 和 Harlequin 的 工作 人 员 也 对 文本 提出 了 意见 。Andrew 
Appel, Gavin Bierman, Phil Brabbin, Richard Brooksby. Guy Cousineau, Lal George. Mike 
Gordon, Martin Hansen, Darrell Kindred, Silvio Meira, Andrew Morris, Khalid Mughal, 


OS 这 两 个 网 址 原 书 没有 ， 中 译本 加 上 的 。 一 一 译 者 注 
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Tobias Nipkow. Kurt Olender, Allen Stoughton, Reuben Thomas, Ray Toal 和 Helen Wilson 2 
现 了 前 几 次 印刷 中 的 错误 。 Piete Brooks, John Carroll 和 Graham Titmus 在 计算 机 使 用 方面 给 
予 了 帮助 。 我 还 要 感谢 Dave Matthews 开 发 了 Poly/ML， 这 是 多 年 以 来 唯一 高 效 的 Standard ML 
的 编译 器 。 

在 众多 的 参考 文献 中 ，Abelson 和 Sussman (1985)、Bird 和 Wadler (1988) 以 及 Burge 
(1975) 的 著作 特别 有 帮助 。Reade (1989) 的 书 中 包含 了 在 ML 中 实现 惰性 表 的 有 用 思想 。 

The Science and Engineering Research Council 在 过 去 20 多 年 来 给 予 了 LCF 和 ML 大 量 的 研 
究 资 助 。 

本 书 的 大 部 分 写作 工作 都 是 我 从 剑桥 大 学 休假 的 过 程 中 完成 的 。 我 感谢 计算 机 实验 室 
(Computer Laboratory) 和 卡 菜 尔 学 院 (Clare College) 给 予 休 假 ， 以 及 爱丁堡 大 学 对 我 六 个 
月 的 招待 。 

最 后 ， 我 要 感谢 Sue， 感 谢 她 所 给 我 的 一 切 帮助 ， 以 及 天 天 耐心 倾听 我 关于 每 一 章 进 展 的 
报道 。 
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第 1 章 Standard ML 


第 一 个 ML 编译 器 是 在 1974 年 实现 的 。 随 着 用 户 群 的 成 长 ， 各 种 语言 的 变 体 开始 出 现 。 于 
是 ，MEL 社 群 便 集中 起 来 开发 和 普及 一 种 通用 的 语言 ，Standard ML， 有 时 简称 为 SML ， 或 干 
脆 就 岂 ML。 现 在 可 以 找到 一 些 很 好 的 Standard ML 编译 器 。 

没 用 多 人 入 Standard ML 就 变 得 相当 流行 。 忆 界 各 地 都 有 大 学 采用 它 作为 教授 学 生 的 第 一 门 
程序 设计 语言 。 开 发 者 选择 它 作为 一 些 具有 相当 规模 的 项 目的 实现 语言 。 也 许 对 于 这 种 流行 
的 初步 解释 是 : 用 ML 很 容易 写 出 清晰 、 可 靠 的 程序 。 要 得 到 更 满意 的 答案 ， 首 先 要 分 析 一 下 
我 们 是 怎样 看 待 计算 机 系统 的 。 

计算 机 是 非常 复杂 的 。 在 一 部 典型 的 工作 站 里 面 所 包括 的 硬件 和 软件 就 远 不 是 一 个 人 所 
能 完全 掌握 的 。 不 同 的 人 对 工作 站 有 不 同 层 次 的 理解 。 对 于 一 般 的 用 户 ， 工 作 站 是 一 部 文字 
处 理 机 或 电子 表格 。 对 于 维修 工 来 说 ， 工 作 站 是 一 个 盒子 ， 里 面 有 电源 和 电路 板 等 。 对 于 机 
器 语言 程序 员 ， 工 作 站 则 提供 了 一 个 巨大 的 字 节 存储 器 ， 连 接 在 一 个 能 够 进行 算术 和 逻辑 运 
算 的 处 理 器 上 面 。 而 应 用 程序 员 则 会 借助 他 所 选择 的 程序 设计 语言 作为 媒介 来 理解 工作 站 。 

这 里 ， 我 们 把 “电子 表格 ”、“ 电 源 ” 和 “处 理 器 ”都 理解 为 理想 的 、 抽 象 的 概念 。 我 们 
只 考虑 它们 的 功能 和 局 限 ， 却 不 关心 它们 是 如 何 构造 的 。 通 过 良好 的 抽象 ， 我 们 可 以 有 效 地 
使 用 计算 机 ， 而 不 会 被 它 的 复杂 性 拖 垮 。 

普通 的 高 级 程序 设计 语言 在 抽象 的 层次 上 并 没有 比 机 器 语言 高 多 少 。 这 些 语言 提供 了 方 
便 的 记号 ， 但 仅 限 于 那些 可 以 被 直接 映射 到 机 器 码 上 去 的 操作 。 程 序 中 一 个 小 的 错误 可 以 破 
坏 其 他 数据 ， 其 至 是 程序 本 身 。 这 种 行为 的 结果 若 能 解释 的 话 也 只 能 是 在 机 器 语言 的 层次 上 
进行 。 

MEL 则 高 出 机 器 语言 层 很 多 。 它 支持 函数 式 程序 设计 (functional programming), Hp, 
程序 是 由 函数 所 组 成 的 ， 这 些 函 数 操作 简单 的 数据 结构 。 函 数 式 程序 设计 在 许多 方面 对 于 解 
决 问题 都 是 非常 理想 的 ， 下 面 会 对 这 个 问题 进行 简单 的 讨论 ， 也 会 贯穿 全 书 来 进行 演示 。 程 
序 设计 任务 可 以 通过 数学 方式 来 达成 ， 而 不 用 事先 知道 计算 机 的 内 部 工作 情况 。ML 也 提供 可 
变 的 (mutable) 变量 和 数组 。 可 变 的 对 象 可 以 通过 赋值 语句 来 改变 ， 利 用 这 些 ， 可 以 很 容易 
表达 任何 传统 的 代码 。 为 了 构造 大 的 系统 ，ML 提 供 了 模块 (module ) ， 程 序 的 某 一 部 分 可 以 
分 别 描述 和 编码 。 

最 为 重要 的 是 ，ML 可 以 防止 程序 员 犯 错误 。 在 程序 可 以 运行 之 前 ， 编 译 器 会 检测 所 有 模 
块 的 接口 是 否 彼此 相 容 ， 以 及 所 有 的 数据 是 否 被 一 致 地 使 用 。 例 如 ， 一 个 整数 不 会 被 用 作 存 
储 地 址 。( 一 个 真正 的 程序 不 应 该 依赖 于 这 种 技巧 . ) 在 程序 运行 中 ， 更 进一步 的 检测 保证 了 
安全 性 : 甚至 是 一 个 错误 的 ML 程序 也 会 表现 得 像 一 个 ML 程序 。 它 可 能 会 永远 运行 下 去 ,或 
者 返回 一 个 错误 信息 给 用 户 。 但 是 它 不 会 崩 潢 。 

ML 支持 一 种 面向 程序 员 要 求 的 抽象 层次 ， 而 不 是 面向 硬件 的 。ML 系 统 可 以 保证 这 种 抽 
象 ， 即 使 程序 是 错误 的 。 其 他 的 程序 设计 语言 很 难 提供 这 种 保障 。 


及 








函数 式 程序 设计 

程序 设计 语言 有 很 多 种 风格 。 像 Fortran、Pascal 和 C 这 样 的 语言 被 称 为 是 过 程式 
(procedural) 的 : 它们 主要 的 程序 设计 单元 是 过 程 。 目 前 流行 的 优化 程序 设计 方法 主要 是 面 
向 对 象 的 ， 这 些 对 象 包含 着 与 它们 自身 相关 的 那些 操作 。 这 种 面向 对 象 (object-oriented) 的 
语言 包括 C++ 和 Modula-3。 这 两 种 实现 方法 都 是 基于 命令 的 ， 这 些 命令 操作 于 机 器 状态 上 ， 
它们 都 是 命令 式 (imperative) 的 方法 。 

如 同 过 程式 语言 是 面向 命令 的 那样 ， 函 数 式 语言 则 是 面向 表达 式 的 。 没 有 命令 的 程序 设 
计 对 一 些 读者 来 说 可 能 很 奇怪 ， 因 此 让 我 们 看 看 这 个 想法 的 背后 到 底 是 什么 ， 就 从 对 命令 式 
程序 设计 的 批评 开始 。 


1.1 表达 式 和 命令 


第 一 个 高 级 程序 设计 语言 Fortran 给 程序 员 们 提供 了 算术 表达 式 。 他 们 不 再 需要 对 寄存 器 
的 加 法 和 存 取 操 作 序列 进行 编码 了 ， 公 式 翻 译 器 (FORmula TRANslator) BAEIT 
为 什么 表达 式 如 此 重要 ? 不 是 因为 它们 广为人知 : 其 实 对 于 下 面 公式 


sin26 
1+|cosq| 


Foertran 的 语法 和 它 仅 是 略 有 相似 而 已 。 让 我 们 还 是 详细 看 一 下 表达 式 的 优点 。 在 Fortran 中 表 
达 式 可 以 有 副作用 (side effect): 它们 可 以 改变 状态 。 而 下 面 我 们 重点 讲解 的 是 仅 计算 一 个 
值 的 纯 表达 式 。 

表达 式 具 有 一 种 递归 的 结构 。 像 下 面 这 样 的 典型 表达 式 

f(E, + E,)— g(F;) 
是 由 其 他 表达 式 E,、E; 和 Es 组 成 的 ， 它 自己 也 可 以 成 为 更 大 的 表达 式 的 一 部 分 。 表 达 式 的 值 
是 递归 地 由 它 的 子 表达 式 给 出 的 。 这 些 子 表达 式 可 以 以 任意 的 顺序 ， 甚 至 是 并 行 地 进行 求 值 。 
表达 式 可 以 利用 数学 定律 来 进行 变形 。 例 如 ， 把 E1+E, 赫 换 成 E+El 并 不 会 影响 上 面 表达 
式 的 值 ， 这 要 归功 于 加 法 的 交换 律 。 这 种 利用 相等 的 项 去 进行 替换 的 能 力 称 为 引用 透明 
(referential transparency), ， 特 别 是 一 个 表达 式 可 以 被 安全 地 替换 成 它 的 值 。 

命令 也 具有 很 多 类 似 的 优点 。 在 现代 语言 中 ， 命 令 是 由 其 他 命令 构成 的 。 像 下 面 的 一 个 
命令 

while Bı do (if B2 then Cı else C?) 

的 含义 可 以 由 它 的 各 个 组 成 部 分 的 含义 给 出 。 命 令 也 可 以 享受 引用 透明 : 像 定 律 

(if B then Cı else C2);C=if B then (C; O) else (C; O 
可 以 证 明 是 成 立 的 ， 并 可 应 用 在 替换 中 。 

但 是 ， 表 达 式 的 含义 只 是 简单 的 求 值 结 果 ， 这 也 是 为 什么 子 表达 式 可 以 相互 独立 地 进行 
求 值 的 原因 。 表 达 式 的 含义 可 以 非常 简单 ， 比 如 数字 3。 而 一 条 命令 的 含义 是 一 个 状态 的 转 
换 或 者 具有 类 似 复杂 性 的 东西 。 想 要 理解 一 条 命令 ， 必 须 了 解 它 对 于 机 器 状态 所 起 的 所 有 
作用 。 
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1.2 过 程式 程序 设计 语言 中 的 表达 式 


自从 Fortran 以 来 ， 程 序 设 计 语 言 到 底 进步 了 多 少 昵 ? 看 一 下 欧 几 里 得 算法 (RIRE). 
这 个 算法 是 递归 定义 的 ， 用 来 计算 两 个 自然 数 的 最 大 公 因 子 (Greatest Common Divisor， 
GCD): 


gca(0,n) =n 
gcd(m, n) = gcd(n mod m, m) 4 m>0 it 
在 Pascal 这 种 过 程式 语言 中 ， 很 多 人 会 将 GCD 编 写成 一 个 命令 式 程序 : 
function gcd(m,n: integer): integer; 
var prevm: integer; 
begin 
while m<>0 do . 
begin prevm := m; m := n mod m; n := prevm end; 
gcd := n 
end; 


而 下 面 是 一 个 使 用 Standard MLE MARKEE: 
fun gcd(m,n) = 
if m=0 then n 
else gcd(n mod m, m); 

命令 式 程序 ， 虽 然 是 用 所 谓 的 “高 级 ”语言 写 的 ， 但 它 并 不 比 机 器 语言 写 的 程序 清楚 、 简 单 
多 少 。 它 重复 地 更 新 三 个 量 ， 其 中 一 个 只 是 临时 的 存储 区 。 想 要 证 明 它 的 确实 现 了 欧 几 里 得 
算法 需要 一 套 宛 长 乏味 的 弗 洛 伊 德 - 霍 尔 (Floyd-Hoare) 证 明 规则 。 相 对 地 ， 那 个 函数 式 版 
本 的 程序 显然 实现 了 欧 几 里 得 算法 。 

用 Pascal 也 可 以 书写 递归 程序 , 但 那 只 是 一 个 小 的 改善 。 递归 的 过 程 调 用 很 难 高 效 地 实现 。 
递归 被 引入 程序 设计 30 多 年 后 ， 仍 被 认为 是 应 该 避免 使 用 的 算法 。 历 史上 ， 递 归 过 程 的 正确 
性 证 明 充满 了 令 人 遗憾 的 错误 和 复杂 性 。 

Pascal 的 表达 式 并 不 满足 通常 的 数学 定律 。 一 个 优化 编译 器 很 可 能 想 将 fz) + u/2 变 形 为 
z/2 + fz)， 但 是 ， 如 果 函 数 /改变 了 u 值 的 话 ， 这 两 个 表达 式 就 可 能 得 不 到 相同 的 值 。Pascal 表 
达 式 的 含义 不 仅 涉及 值 也 关系 到 状态 。 在 所 有 现实 的 应 用 中 ， 都 形 失 了 引用 透明 。 

在 纯 的 函数 式 语言 中 是 没有 状态 的 。 表 达 式 在 机 器 精度 的 范围 内 (例如 实数 运算 是 近似 
的 ) 满足 通常 的 数学 定律 。 纯 函数 式 程序 是 可 以 利用 Standard ML 书写 的 ， 不 过 ，ML 并 不 纯 
粹 ， 因 为 它 有 赋值 语句 和 输入 输出 命令 。 那 些 风格 “几乎 ”是 函数 式 的 ML 程序 员 最 好 不 要 有 
引用 透明 的 错觉 。 


1.3 存储 管理 


过 程式 语言 中 的 表达 式 在 Fortran 之 后 就 没什么 进展 了 ， 没 跟 上 数据 结构 发 展 的 步伐 。 假 
如 我 们 有 包含 姓名 、 地 址 和 其 他 信息 的 雇员 记录 ， 我 们 并 不 能 写 出 以 记录 为 值 的 表达 式 ， 或 
是 从 函数 返回 一 个 雇员 记录 ， 即 便 有 的 语言 允许 这 样 做 ， 撕 中 如 此 大 的 记录 也 是 慢 得 令 人 无 
法 忍受 。 

为 了 避免 揽 贝 大 的 对 象 ， 我 们 可 以 间接 地 引用 它们 。 以 记录 作为 返回 值 的 函数 可 以 为 雇 
员 记 录 分 配 存储 空间 ， 然 后 返回 它 的 存储 地 址 。 代 替 将 记录 来 回 拷贝 ， 我 们 只 是 拷贝 了 它 的 
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地 址 。 在 雇员 记录 使 用 结束 后 ， 再 来 释放 它 的 存储 空间 。 以 这 种 方式 来 使 用 的 地 址 被 称 作 引 
用 (reference) 或 指针 (pointer). 

释放 是 这 种 方法 的 大 问题 。 记 录 仍 在 使 用 的 时 候 ， 程 序 可 能 就 释放 了 它 的 存储 空间 ， 这 
时 ， 当 这 个 空间 被 再 次 分 配 时 ， 它 会 局 时 被 用 作 不 同 的 目的 。 这 之 后 ,任何 事情 都 可 能 发 生 ， 
(可 能 是 在 很 久 以 后 ) 导致 程序 莫名 其 妙 地 崩溃 。 这 是 最 危险 的 程序 设计 错误 之 一 。 

如 果 永 远 不 释放 存储 空间 ， 我 们 就 会 遇 到 没有 存储 空间 的 时 候 。 那 么 ， 是 不 是 要 避免 使 
用 引用 呢 ? 然而 ， 很 多 基本 的 数据 结构 (如 链接 表 ) 是 离 不 开 引 用 的 。 

函数 式 语言 以 及 其 他 一 些 语言 是 自动 管理 存储 空间 的 。 程 序 员 并 不 用 决定 什么 时 候 去 释 
放 一 个 记录 的 存储 空间 。 运 行 时 系统 间歇 性 地 扫描 存储 空间 ， 标 记 出 那些 仍 可 以 访问 到 的 空 

间 ， 然 后 将 剩 下 的 回收 。 这 个 操作 称 为 垃圾 收集 (garbage collection) ， 尽 管 称 之 为 回收 更 合 
活 二 起 收集 可 能 会 很 介 并 项 要领 外 的 空间 ， 但 是 值得 的 。 

具有 垃圾 收集 功能 的 语言 通常 都 是 大 量 使 用 引用 来 作为 数据 的 内 部 表示 法 。“ 返 回 ” 一 个 
雇员 记录 的 函数 其 实 只 是 返回 它 的 引用 而 已 ， 但是， 程序 员 不 知道 也 不 关心 这 一 点 。 语 言 会 
因此 获得 更 丰富 的 表达 能 力 。 程 序 员 在 摆脱 了 存储 管理 的 杂事 以 后 ， 工 作 会 更 有 成 效 。 
1.4 函数 式 语言 的 元 素 

函数 式 程序 是 跟 值 打交道 的 ， 而 不 是 跟 状 态 打交道 的 。 它 们 的 工具 是 表达 式 ， 而 不 是 命 
令 。 那 么 怎样 才能 免 去 赋值 、 数 组 和 循环 呢 ? 难道 这 个 世界 没有 状态 吗 ? 这 样 的 问题 确实 很 
有 挑战 性 。 不 过 ， 函 数 式 程序 员 自 有 一 套 解 决 问题 的 技术 。 

A (list) 和 树 (tree)。 数 据 集 可 以 作为 下 面 这 样 的 表 来 处 理 : 

[a, b,c,d,e,...] 


表 支 持 顺序 访问 : 从 左 到 右 地 进行 扫描 。 这 对 于 大 部 分 应 用 来 说 已 经 足够 了 ， 其 至 可 以 应 用 
于 排序 和 人 矩阵 运算 。 更 为 灵活 的 方式 就 是 把 数据 组 织 成 树 : 


d 


ry OY) 
OO © (©) 

平衡 树 允 许 随机 访问 :可 以 很 快速 地 到 达 任何 一 部 分 。 理 论 上 ， 树 提供 了 和 数组 相同 的 
效率 ; 不 过 实践 中 ， 数 组 通常 更 快 一 些 。 在 符号 运算 中 ， 树 扮演 了 非常 重要 的 角色 ， 比 如 ， 
它 在 定理 自动 证 明 中 可 以 表达 那些 逻辑 项 和 公式 。 表 和 树 都 是 通过 引用 来 表示 的 ， 因 此 ， 
行 时 系统 要 带 有 垃圾 收集 器 。 

函 数 〈function)。 表 达 式 主要 是 由 函数 调用 组 成 的 。 为 了 增强 表达 式 的 能 力 ， 必 须 取 消 
对 于 函数 的 种 种 强迫 限制 。 函 数 可 以 使 用 任何 类 型 的 参数 ， 也 可 以 返回 任何 类 型 的 结果 。 如 
我 们 将 看 到 的 那样 ,“ 任 意 类 型 ”包括 函数 本 身 ， 都 可 以 像 其 他 数据 一 样 地 使 用 ， 为 了 能 这 样 
使 用 ， 同 样 需要 垃圾 收集 器 。 

递归 (recursion)。 在 函数 式 程序 中 ， 变 量 是 通过 外 部 传人 ( 当 一 个 函数 被 调用 时 ) 或 者 
声明 来 获得 值 的 。 变 量 不 能 被 再 次 更 新 ， 不 过 递归 调用 可 以 制造 一 系列 变化 的 参数 值 。 递 归 
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要 比 迭 代 更 容易 理解 ， 如 果 你 不 相信 这 点 的 话 ， 尽 可 以 参考 上 面 的 两 个 GCD 程 序 。 递 归 省 掉 
了 过 程式 语言 里 结构 复杂 的 循环 构造 。。 
模式 匹配 (pattern-matching )。 大 多 数 国 数 式 语 言 都 允许 函数 通过 模式 匹配 来 分 析 它 的 参 
数 。 计 算 表 中 元 素 个 数 的 函数 在 ML 中 是 这 样 的 : 
fun length [] = 0 
| length (x::xs) = 1 + length xs; 
我 们 立刻 就 看 到 了 空 表 (0D) 的 长 度 是 零 ， 并 且 一 个 以 元 素 x* 开 头 ， 后 接 子 表 xs 的 表 的 长 度 是 
子 表 xs 的 长 度 加 上 一 。 这 里 有 一 个 等 价 的 函数 定义 ， 它 是 用 没有 模式 匹配 的 语言 Lisp 写 的 : 
(define (length x) 
(if (null? x) 
0 
(+ 1 (length (cdr x))))) 
ML 的 函数 通常 要 考虑 很 多 情况 ， 遇 到 的 模式 要 比 x: :xs 复杂 得 多 。 不 用 模式 匹配 来 表达 这 样 
的 函数 是 非常 麻烦 的 。ML 的 编译 器 在 内 部 做 了 模式 匹配 ， 要 比 程序 员 自 己 来 做 好 得 多 。 
多 态 类 型 检测 (polymorphic type checking )。 作 为 人 ， 程 序 员 经 常会 犯错 误 。 使 用 数据 结 
构 并 不 存在 的 一 部 分 ， 给 一 个 函数 提供 过 少 的 参数 ， 以 及 混 奖 对 象 的 引用 和 对 象 本 身 都 是 非 
常 严重 的 错误 : 它们 都 有 可 能 使 程序 崩溃 。 但 幸运 的 是 ， 如 果 一 种 语言 强制 使 用 类 型 作为 律 
条 的 话 ， 编 译 器 是 可 以 在 程序 运行 前 发 现 这 些 错误 的 。 类 型 (type) 将 数据 归 类 为 整数 、 实 
数 、 表 等 ， 并 且 让 我 们 可 以 保证 以 合理 的 方式 使 用 它们 。 
有 些 程序 员 反对 类 型 检测 ， 因 为 这 种 检测 可 能 会 过 于 严格 。 在 Pascal 中 ， 一 个 计算 表 长 度 
的 函数 必须 指定 一 一 一 个 完全 无 关 的 东西 一 表 元 素 的 类 型 。ML 的 长 度 函 数 对 于 所 有 的 表 都 有 
效 ， 因 为 ML 的 类 型 系统 是 多 态 的 (polymorphic): 它 忽 略 了 无 关 的 数据 的 类 型 。 我 们 的 Lisp 
版 本 也 同样 可 以 不 指定 表 的 数据 类 型 ， 因 为 Lisp 根 本 就 没有 编译 时 的 类 型 检测 。Lisp 比 ML 还 
要 灵活 ， 一 个 表 中 可 以 有 不 同类 型 的 元 素 。 这 种 自由 的 代价 就 是 ， 本 来 可 以 自动 捕获 的 错误 
需要 花 上 几 个 小 时 才能 发 现 。 
3 Mp 4% (higher-order function )。 国 数 本 身 也 是 可 计算 的 值 。 其 至 就 连 Fortran 都 允许 一 
个 函数 作为 另 一 个 函数 的 参数 传人 ,但 是 几乎 没有 过 程式 语言 允许 函数 作为 值 来 扮演 数据 结 
构 所 能 扮演 的 一 切 角色 。 
高 阶 (higher-order) 函数 ,或 称 为 算 子 (functional)， 是 一 种 操作 于 另 一 个 (或 几 个 ) 
消 数 之 上 的 函数 。map 算 子 ， 当 应 用 于 也 数 上 时 ， 返 回 另 一 个 函数 ， 这 个 被 返回 的 函数 将 
[xis xX2,.…, Xs] 变换 成 V), fx2),.…, fxn)] 
男 一 个 高 阶 函 数 ， 当 应 用 于 函数 和 一 个 值 e 时 ， 返 回 
Fon, fo, ..., fxn, 2)...)) 
如 果 e = 0 且 f=+ (是 的 ， 加 法 运算 是 一 个 函数 ) 的 话 ， 我 们 就 得 到 了 xi,…, x 的 和 ， 它 是 这 样 
计算 的 


xX, 十 Oo 二 二 (xn + 0)…) 


日” 递归 也 确实 受到 过 批评 。Backus (1978) 建议 提供 从 代 原 语 来 取代 大 多 数 函 数 定义 中 所 使 用 的 递归 。 但 是 ， 
他 的 函数 式 程序 设计 风格 并 没有 赶 上 发 展 的 步伐 。 





如 果 e = 1 且 太 = x 的 话 ， 我 们 就 得 到 了 它们 的 连 乘积 ， 它 是 这 样 计 算 的 
X X (xxX(xzx1l)…) 
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无 穷 数 据 结构 (infinite data structure)。 像 [1,2,3,.….] 这 样 的 无 穷 表 也 可 以 赋予 计算 上 的 意义 。 
当 磁 到 较为 深入 的 问题 时 使 用 它们 可 以 带 来 方便 。 无 穷 表 是 通过 惰性 求 值 (lazy evaluation) 来 
处 理 的 ,这 使 得 无 穷 表 不 会 计算 任何 值 或 其 中 的 部 分 值 ， 除 非 这 些 值 是 获得 最 后 结果 所 必需 的 。 
一 个 无 穷 表 永 远 不 会 以 完整 的 面目 出 现 ， 可 以 把 它 看 作 是 计算 相继 元 素 的 过 程 。 

自动 定理 证 明 系 统 中 的 搜索 空间 可 以 构成 一 棵 无 穷 树 ， 里 面相 连 的 结 点 则 可 以 构成 一 个 
无 穷 表 。 不 同 的 搜索 策略 产生 出 具有 不 同 相 连结 点 的 表 。 这 个 〈 抽 象 的 无 穷 的 ) 表 又 可 以 被 
传 到 程序 的 其 他 部 分 ， 对 子 程序 来 说 ， 表 是 如 何 产生 的 并 不 重要 。 

无 穷 表 也 可 以 表示 输入 输出 序列 。 我 们 很 多 人 都 会 在 Unix 操 作 系 统 的 管道 (pipe) Fis 
到 这 个 概念 。 由 管道 连接 而 成 的 一 系列 进程 组 成 了 一 个 大 的 进程 。 每 个 进程 都 在 消费 就 绪 的 
输入 ， 然 后 将 输出 通过 管道 传递 给 下 一 个 进程 。 中 间 进 程 的 输出 从 不 会 被 完整 地 存储 下 来 。 
这 不 但 节省 存储 开销 ， 更 重要 的 是 ， 它 提供 了 清晰 的 组 合 进程 的 表示 法 。 从 数学 的 角度 看 ， 
每 个 进程 都 是 一 个 将 输入 变换 成 输出 的 函数 ， 而 进程 链 则 是 函数 的 复合 。 

输入 和 和 输出。 和 具有 状态 的 外 部 世界 通信 ， 在 函数 式 程序 设计 里 则 变 得 不 太 自 然 了 。 无 
穷 表 确实 可 以 处 理 输入 输出 序列 (就 像 上 面 提 到 的 )， 但 交互 式 的 程序 设计 和 进程 间 的 通讯 问 
题 却 是 非常 棘手 的 。 为 了 解决 这 个 上 问题， 人们 研究 出 很 多 种 函数 式 的 方法 ， 单 子 (monad) 
是 其 中 最 有 成 效 的 一 个 (Peyton Jones 和 Wadler，1993)。 而 MIL 则 只 是 简单 地 提供 了 输入 输出 

[s] 命令 , 也 就 是 说 ，ML 在 这 个 问题 上 放弃 了 函数 式 程序 设计 。 


函数 式 语言 的 概况 。 主 流 的 函数 式 语言 采用 了 惰性 求 值 、 模 式 匹配 和 ML 方式 的 
多 态 类 型 。Miranda 是 一 种 优雅 的 语言 ， 它 出 自 David A. Turner (1990a), Lazy ML 
是 ML 的 一 个 带 有 惰性 求 值 的 变种 ， 它 的 编译 器 可 以 产生 高 效 的 代码 (Augustsson 和 
Johnsson，1989 )。Haskell 是 由 研究 员 们 组 成 的 一 个 委员 会 设计 的 ， 作 为 一 种 通用 的 
语言 (Hudak 等 ，1992)， 已 经 被 广泛 地 采用 了 。 

John Backus (1978) 在 一 个 大 型 的 公开 演讲 中 介绍 了 他 的 FP 语言 。FP 提 供 了 大 
量 的 高 阶 涵 数 (被 称 为 “组 合式 ”)， 但 程序 员 却 不 能 定义 新 的 高 阶 函 数 。Backus 批 
评 了 程序 设计 语言 和 底层 执行 硬件 的 紧 厢 合 ， 引 进 了 冯 . ER RAM (von Neumann 
bottleneck) 来 描绘 处 理 器 和 存储 间 的 联系 。 许 多 意见 认为 函数 式 语 言 在 并 行 的 硬件 
上 运行 非常 理想 。Sisal 就 是 被 设计 用 来 进行 并 行 数值 计算 的 ，Cann (1992) 声称 
Sisal 有 时 在 性 能 上 超过 了 Fortran。 

许多 函数 式 程序 设计 的 实现 技术 ， 例 如 垃圾 收集 ， 都 是 源 自 Lisp (McCarthy 等 ， 
1962) 的 。 这 种 语言 包含 了 底层 的 功能 ， 若 错误 地 应 用 就 可 能 导致 灾难 性 的 后 果 。 
后 来 的 变种 ， 包 括 Scheme (AbelsonfeSussman, 1985) 和 Common Lisp， 提 供 了 高 
阶 函 数 。 虽 然 许 多 Lisp 代 码 都 是 命令 式 的 ,但 第 一 个 画 数 式 程序 却 是 用 Lisp 写 出 来 的 。 
大 多 数 ML 的 变种 都 包含 一 些 命令 式 的 功能 ， 但 是 ML 要 比 Lisp 更 有 原则 。ML 有 编译 
时 的 类 型 检测 ， 并 且 只 允许 更 新 可 变 对 象 。 
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15 函数 式 程序 设计 的 效率 


典型 的 函数 式 程序 都 有 庞大 的 运行 系统 和 常 驻 编译 程序 。 垃 圾 收集 器 可 能 需要 统一 的 数 
据 表示 方式 ， 这 会 占用 额外 的 空间 。 函 数 式 程序 员 有 时 会 失去 一 些 非常 高 效 的 数据 结构 ， 例 
如 ， 数 组 、 字 符 串 和 位 向 量 。 因 此 ， 银 数 式 程序 可 能 不 如 相应 的 C 程 序 那 样 高 效 ， 尤 其 是 在 空 
间 的 需求 上 。 

ML 最 适合 大 型 的 、 复 杂 的 应 用 程序 。 函 数 式 程序 设计 中 的 类 型 检测 、 自 动 存 储 分配 和 其 
他 优点 可 以 让 人 体会 到 一 个 程序 能 否 正确 工作 的 区 别 。 效 率 这 时 成 为 了 次 要 的 问题 ; 另外 ， 
对 于 一 个 本 来 就 有 很 大 开销 的 程序 ， 效 率 上 的 差别 就 没 那 么 明显 了 。 大 多 数 函 数 式 程序 和 相 
应 的 过 程式 程序 差不多 快 ， 也 许 在 最 坏 的 情况 下 要 慢 五 倍 。 

许多 研究 人 员 都 怀疑 效率 的 重要 性 ， 无 疑 是 因为 追求 效率 曾经 导致 了 很 多 程序 的 崩溃 。 
函数 式 程序 员 有 时 为 了 清晰 宁可 选择 低 效 的 算法 ， 或 者 是 想 办 法 去 丰富 一 种 语言 而 不 是 想 着 
怎样 更 好 地 实现 它 。 更 多 的 是 这 种 态度 ， 而 不 是 什么 技术 上 的 原因 ， 使 得 函数 式 程序 设计 给 
人 留 下 了 效率 低下 的 印象 。 

现在 ， 我 们 必须 重新 选择 平衡 点 。 函 数 式 程序 必须 是 高 效 的 ， 否 则 没 人 会 去 用 它 。 算 法 
最 终 也 是 为 了 效率 而 设计 的 。 两 个 数 的 最 大 公 因 子 当 然 可 以 在 所 有 可 能 的 数 里 面 去 寻找 而 得 
出 。 这 种 穷尽 的 搜索 算法 非常 清晰 ， 但 是 毫 无 用 处 。 欧 几 里 得 算法 虽然 牺 和 性 了 一 些 清晰 性 ， 
却 简单 而 快速 。 

求 取 GCD 的 穷 举 搜索 算法 是 一 个 可 执行 描述 (executable specification) 的 例子 。 一 种 程序 
设计 的 方法 是 : 以 此 为 起 点 ， 通 过 应 用 变换 (transformation) 来 提高 效率 ， 并 同时 保持 算法 的 
正确 性 。 最 后 ， 它 可 能 会 得 到 欧 几 里 得 算法 。 程 序 变换 确实 可 以 改善 效率 ， 不 过 我 们 应 该 小 心 
的 看 待 可 执行 描述 。 两 个 整数 的 最 大 公 因 子 的 定义 是 : 可 以 同时 整除 这 两 个 数 的 最 大 整数 。 这 
个 描述 里 根本 就 没有 提 到 什么 搜索 。 穷 举 搜索 算法 并 不 是 一 个 好 的 描述 方法 ， 因 为 它 太 复杂 了 。 

函数 式 程序 设计 和 逻辑 式 程序 设计 都 属于 声明 式 程序 设计 (declarative programming ) 。 
最 理想 的 声明 式 程序 设计 就 是 不 用 我 们 写 什么 程序 ， 只 是 声明 我 们 的 要 求 ， 然 后 计算 机 就 会 
处 理 余下 的 工作 。Hoare (1989c) 曾经 用 最 大 公 因 子 的 例子 探讨 了 这 个 理想 ,演示 的 结果 表 
明 这 依然 是 一 个 梦想 。 更 为 现实 的 一 个 目标 就 是 利用 声明 式 程序 设计 来 使 得 程序 更 加 易 懂 。 
并 且 可 以 通过 简单 的 数学 论证 来 判断 它们 的 正确 性 ， 而 不 用 思考 字 节 层面 的 问题 。 声 明 式 程 
序 设 计 依 旧 是 程序 设计 ， 我 们 仍然 必须 编制 出 高 效 的 代码 。 

这 本 书 给 出 了 帮助 你 判断 哪里 需要 注意 效率 问题 的 具体 建议 。 大 多 数 自 然 的 国 数 式 定 义 
同时 也 是 相当 高 效 的 。 一 些 ML 编 译 器 提供 了 运行 评价 功能 (execution profiling )， 它 可 以 测 
量 每 个 函数 的 运行 时 间 。 那 个 花费 时 间 最 长 的 函数 〈 从 来 不 是 你 所 认为 的 那个 ) 将 成 为 主要 
的 改进 对 象 。 这 种 自 底 向 上 的 优化 可 以 产生 显著 的 效果 ， 虽 然 它 不 能 揭示 出 全 局 低 效 的 原因 。 
对 于 程序 设计 来 说 ， 这 些 建 议 都 是 通用 的 ， 不 论 是 函数 式 的 、 过 程式 的 、 面 向 对 象 的 或 者 其 
他 什么 。 

正确 性 无 疑 是 首要 的 ， 清 晰 性 通常 次 之 ， 而 效率 则 是 第 三 位 的 。 任 何 牺 牲 清晰 性 的 程序 
都 会 更 难于 维护 ， 除 非 这 样 做 能 显著 地 提升 效率 。 明 智 地 兼顾 现实 和 原则 ， 加 上 足够 的 耐心 ， 
就 可 能 做 出 高 效 的 程序 。 
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O BRARFLHOEM, BRALALUESAMAALEH, BARR, i 
算 机 辅助 设计 以 及 其 他 涉及 符号 运算 的 项 目 中 。 很 多 编译 器 都 是 用 (也 是 为 了 ) 
Standard ML (Appel, 1992) 和 Haskell (Peyton Jones, 1992) 书写 的 。 曾 经 有 网 络 
软件 也 是 用 ME 书写 的 《Biagioni 等 ，1994)， 它 演示 了 ML 在 系统 程序 设计 方面 的 用 
途 。 一 个 重要 的 自然 语言 处 理 系统 ， 叫 做 LOLITA ， 是 用 Haskell 书 写 的 (Smith 等 ， 
1994)， 作 者 采用 函数 式 程序 设计 来 处 理 这 个 复杂 的 系统 。Hartel 和 Plasmeijer (1996) 
描述 了 六 个 主要 的 函数 式 程序 设计 项 目 ， 涉及 各 个 方面 的 应 用 。Wadler 和 Gill (1995) 
曾经 将 这 些 实际 应 用 汇编 成 表 ， 其 覆盖 了 很 多 的 领域 并 且 涉 及 了 所 有 重要 的 函数 式 


语言 。 
Standard ML 概述 


几乎 所 有 成 功 的 语言 起 初 都 是 为 了 某 种 特殊 的 用 途 而 设计 的 : Lisp 是 为 了 人 工 智能 ， 
Fortran 是 为 了 数值 计算 ，Prolog 是 为 了 自然 语言 处 理 。 相 对 地 ， 那 些 为 了 通用 目的 设计 的 语 
言 ， 例 如 那些 “算法 语言 ”Algol 60 和 Algol 68， 其 作为 一 种 思想 比 作为 一 种 实用 的 工具 更 为 
成 功 。 

ML 是 为 了 自动 定理 证 明 而 设计 的 。 这 并 不 是 一 个 很 广泛 的 领域 ， 而 且 ML 是 专门 为 了 编 
写 其 中 一 种 定理 证 明 机 而 设计 的 ， 目 的 非常 明确 ! 这 个 叫做 爱丁堡 LCF 的 (可 计算 函数 的 逻 
辑 ，Logic for Computable Function) 定理 证 明 机 繁衍 出 了 一 堆 后 继 者 ， 它 们 都 是 用 ML 编写 的 。 
就 像 Lisp、Fortran 和 Prolog 的 许多 应 用 已 经 远离 了 语言 的 设计 初 正 一样 ，ML 也 被 用 于 各 种 各 
样 的 领域 中 。 


1.6 Standard ML 的 演化 


正如 ML 被 称 为 证 明 策 略 编程 的 元 语言 (Meta Language) 那样 ， 它 的 设计 者 为 了 这 个 应 
用 加 入 了 必要 的 功能 : 

。 推 导 规则 和 证 明 方 法 都 是 要 用 轴 数 来 表示 的 ， 因 此 ML 被 赋予 了 高 阶 函数 式 程序 设计 的 

全 部 能 力 。 

“推导 规则 需要 定义 一 个 抽象 类 型 : 定理 类 型 。 强 类 型 检测 〈 像 在 Pascal 里 面 的 ) 会 过 分 

严格 ， 因 此 ML 采用 了 多 态 类 型 检测 。 

* 证 明 方 法 可 能 以 非常 复杂 的 方式 组 合 。 必 须发 现 所 有 的 失败 ， 然 后 ， 才 能 尝试 其 他 的 方 

法 。 因 此 ，ML 拥 有 了 抛 出 和 捕获 异常 的 功能 。 
。 如 果 一 个 定理 证 明 机 有 漏 铜 的 话 ， 那 么 ， 它 将 毫 无 用 处 ， 因 此 ML 设计 得 非常 安全 ， 绝 
不 会 破坏 其 运行 环境 。 

为 爱丁堡 LCF 设 计 的 ML 系统 是 非常 缓慢 的 : 首先 程序 被 翻译 成 Lisp ， 然 后 进行 解释 执行 。 
Luca Cardelli 为 自己 的 ML 版 本 书写 了 高 效 的 编译 器 ， 里 面包 括 了 丰富 的 声明 和 类 型 结构 。 在 
剑桥 大 学 和 INRIA，LCE 的 ML 系统 得 到 了 扩充 和 性 能 上 的 改进 。ML 也 影响 了 HOPE， 这 种 纯 
国 数 式 语 言 采 用 了 多 态 性 ， 并 增加 了 递归 类 型 定义 和 模式 匹配 。 

Robin Milner 曾 试图 将 这 些 变种 整合 到 Standard ML 中 去 。 很 多 人 都 参与 到 了 其 中 。 模 块 
语言 一 一 最 具 复 杂 和 创新 的 语言 功能 一 一 是 由 David MacQueen 设 计 ，Milner 和 Mads Tofte 优 化 
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的 。1987 年 ，Milner 因 为 他 在 Standard ML 中 的 工作 而 获得 了 英国 计算 机 界 优秀 技术 大 奖 。 第 
一 批 编译 器 是 在 剑桥 和 爱丁堡 大 学 中 研发 的 ， 不 久 ， 非 常 出 色 的 Standard ML of New Jersey 就 
问世 了 。 

有 几 所 大 学 都 以 教授 Standard ML 来 作为 学 生 的 第 一 门 程序 设计 语言 。ML 适 合 所 有 层次 
的 学 生 ， 不 论 他 们 事先 是 否 知道 C、Basic、 机 器 语言 或 是 什么 都 不 知道 。 使 用 ML ， 学 生 们 可 
以 学 会 如 何 使 用 数学 思想 去 分 析 问 题 ， 打 破 那些 低级 语言 培养 的 坏 习惯 。 大 量 的 计算 可 以 在 
儿 行 之 内 表达 清楚 。 初 学 者 特别 喜欢 类 型 检测 器 可 以 检测 出 常见 的 错误 ,而 且 系 统 绝 不 会 崩 
iit. 

在 1.5 节 中 我 们 提 到 了 Standard ML 在 网 络 和 编译 器 构造 等 方面 的 应 用 。 然 而 ， 定 理 证 明 仍 
旧 是 ME 的 一 个 最 重要 的 应 用 领域 ， 下 面 将 会 看 到 。 
(O| 进一步 的 阅读 。Gordon 等 (1979) 描述 了 LCF。Landin (1966) 讨论 了 ISWIM 
语言 ，ML 最 初 就 是 以 这 个 语言 为 基础 的 。 正 式 的 Standard ML 定义 已 经 出 版 成 书 
(Milner 等 ，1990)， 并 且 有 单独 的 一 卷 评论 (Milner 和 Tofte，1990) 9°, 

Standard ML 并 没有 取代 所 有 的 变种 。 特 别 是 法 国人 ， 他 们 另 辟 跷 径 。 他 们 的 
CAML 语 言 (Cousineau 和 Huet，1990) 广泛 地 提供 了 类 似 的 功能 ， 不 过 保留 了 原先 
ISWIM 的 传统 语法 。 它 在 语言 设计 实验 方面 是 有 用 的 ， 并 且 它 的 扩展 超过 了 Standard 
ML， 包 括 了 惰性 数据 结构 〈lazy data structure) 和 动态 类 型 。CAML Light 是 一 个 简 
单 的 字 节 码 解 释 器 ， 它 很 适合 小 型 的 计算 机 系统 。 采 用 情 性 来 值 的 ML 变种 仍然 存在 ， 
前 面 也 提 到 过 了 。HOPE 也 继续 被 使 用 和 传授 着 (Bailey, 1990), 


1.7 ML 的 自动 定理 证 明 传统 


自动 定理 证 明和 函数 式 程序 设计 手 拉手 地 成 长 。 最 早 的 一 批 函数 式 程序 之 一 就 是 一 个 简 
单 的 定理 证 明 机 (McCarthy 等 ，1962)。 旱 在 20 世 纪 70 年 代 ， 当 一 些 研究 人 员 还 在 奇怪 着 函 
数 式 程序 设计 到 底 有 什么 用 的 时 候 ， 爱 丁 堡 LCF 已 经 使 用 它 来 工作 了 。 

完全 自动 的 定理 证 明 几 乎 是 不 可 能 有 的 : 对 于 大 多 数 逻 辑 来 说 ， 没 有 已 知 的 自动 方法 。 
另 一 个 明显 的 自动 定理 证 明 的 替代 品 一 一 证 明 检测 ， 很 快 就 让 人 难以 接受 。 大 多 数 证 明 都 涉 
及 元 长 而 反复 的 规则 组 合 。 

爱丁堡 LCF 代 表 了 一 种 新 型 的 定理 证 明 机 ， 其 中 自动 化 的 层次 完全 由 使 用 者 决定 。 它 基 
本 上 是 一 个 可 编程 的 证 明 检 测 机 。 使 用 者 可 以 使 用 ML 一 一 Meta Language (元 语言 ) 一 一 来 
书写 证 明 的 过 程 ， 而 不 用 输入 重复 的 命令 。ML 程 序 可 以 在 对 象 语言 的 表达 式 上 操作 ， 这 种 对 
象 语言 就 叫做 Scott 可 计算 函数 逻辑 。 

爱丁堡 LCF 引 入 了 将 逻辑 表达 作为 一 个 关于 定理 的 抽象 类 型 的 思想 。 每 条 公理 都 是 一 个 
基本 的 定理 ， 而 推导 规则 就 是 从 定理 到 定理 的 函数 。 类 型 检测 保证 了 定理 只 能 由 公理 和 规则 
产生 。 将 推导 规则 应 用 于 已 知 的 定理 ， 一 条 规则 接 一 条 规则 地 向 前 进行 ， 便 构造 出 了 证 明 。 

策略 (tactic) 允许 使 用 更 自然 的 反 向 证 明 形 式 。 每 个 策略 都 是 一 个 从 目标 到 子 目 标的 函 
数 ， 这 个 函数 需要 判断 是 否 存在 一 条 反 向 的 推导 规则 。 策 略 实际 上 是 返回 了 这 个 推导 规则 





日 ”根据 作者 的 勘误 表 : Milner 的 书 已 经 有 了 1997 年 的 新 版 。 一 一 译 者 注 
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(作为 一 个 国 数 ): 因此 ， 策 略 是 高 阶 函 数 。 

RAAF (tactical) 提供 了 将 简单 策略 组 合成 复杂 策略 的 控制 结构 。 得 出 的 策略 可 以 进 
一 步 组 合成 更 为 复杂 的 策略 ， 这 样 的 策略 可 能 一 步 就 进行 了 几 百 条 基本 的 推导 。 策 略 算 子 比 
策略 更 为 “高 阶 ”。 高 阶 函 数 的 新 用 途 出 现在 重 写 技术 等 其 他 方面 。 


O 进一步 的 阅读 。 自 动 定理 证 明 的 起 源 是 人 工 智能 中 的 一 个 任务 。 后 来 的 研究 将 
它 应 用 到 了 推理 任务 上 ， 例 如 制定 计划 (Rich 和 Knight，1991)。 程 序 验 证 的 目的 是 
证 明 软 件 的 正确 性 。 然 而 ， 作 为 新 领域 的 硬件 验证 却 更 成 功 ，Graham (1992) 描述 
了 一 个 相当 复杂 的 VLSI 芯片 的 验证 ， 同 时 也 对 其 他 工作 进行 了 评述 。 

爱丁堡 LCF 的 分 支 包 括 了 使 用 高 阶 逻辑 的 HOL88 (Gordon 和 Melham，1993 )， 
以 及 支持 构造 性 论证 的 Nuprl (Constable 等 ，1986)。 

其 他 近期 的 系统 则 采用 Standard ML。LAMBDA 是 一 个 硬件 合成 工具 ， 它 用 于 设 
计 电 路 并 同步 地 利用 高 阶 远 辑 来 证 明 电 路 的 正确 性 。ALE 是 一 个 构造 性 类 型 理论 的 
证 明 编 辑 器 (Magnusson 和 Nordstrom，1994 ) 。 


1.8 新 标准 库 

MIL 的 定义 中 描述 了 一 个 包含 标准 声明 的 小 型 库 , 里 面包 括 了 关于 数 、 字 符 串 和 表 的 操作 。 
很 多 人 都 觉得 这 个 库 不 够 用 。 例 如 ， 里 面 没有 将 字符 串 " 3 .14" 转 换 成 实数 的 功能 。 在 人 们 将 
MEL 用 到 系统 程序 设计 和 其 他 没有 预见 到 的 领域 时 ， 这 个 库 的 缺点 变 得 更 加 明显 。 一 个 由 多 个 
编译 器 编写 小 组 组 成 的 委员 会 起 草 了 新 的 ML 标准 库 (Gansner 和 Reppy，1996)。 在 写 这 本 书 
的 时 候 它 还 在 开发 中 ， 不 过 我 们 已 经 知道 了 它 的 基本 框架 。8 

这 个 库 需 要 对 ML 本 身 做 出 一 些小 的 改动 ， 它 引进 了 字符 类 型 ， 与 长 度 为 一 的 字符 串 加 以 
区 分 。 它 允许 内 部 表示 不 同 的 多 个 数值 类 型 同时 存在 ， 因 此 也 保持 了 它们 各 自 的 精度 ， 这 改 
变 了 我 们 对 待 一 些 数值 函数 的 做 法 。 

库 是 由 ML 的 模块 组 成 的 。 很 多 函数 都 是 ML 结构 (structure) 的 成 员 ， 这 些 结构 的 内 容 是 
通过 ML 签名 (signature) 来 描述 的 。 函 数 并 不 能 单 由 它 的 名 字 来 调用 ， 而 必须 带 上 它 所 属 结 
构 的 名 字 ; 例如 ， 实 数 的 符号 函数 是 Real.sign 而 不 是 sign。 很 多 函数 不 止 出 现在 一 个 结构 中 ， 
例如 ， 库 也 提供 Int.sign。 当 我 们 后 面 讨论 到 模块 时 ， 库 可 以 帮助 我 们 了 解 其 关键 概念 。 下 面 
总 结 了 库 的 主要 组 成 部 分 ， 以 及 相关 的 结构 : 

。 表 和 序 偶 表 的 操作 属于 结构 List 和 ListPair， 它 们 中 的 一 些 内 容 会 在 稍 后 章节 讲述 。 

。 整 数 操作 属于 结构 Imz。 整 数 可 能 有 几 种 精度 。 这 里 面 可 能 包括 了 通常 硬件 支持 的 整数 

(结构 FixedInt)， 非 常 高 效 但 是 大 小 有 限 。 也 可 能 包括 无 限 精 度 的 整数 (结构 IntInf)， 

它 是 某 些 任务 所 必需 的 。 

。 实 数 操作 属于 结构 Real， 不 过 像 sgrt+、sin 和 cos 这 样 的 函数 则 属于 Math。 实 数 也 可 能 会 

有 几 种 精度 。 像 Real32 或 Rea164 这 样 名 字 的 结构 表明 了 实数 所 用 的 二 进 制 位 数 。 

。 无 符号 整数 的 运算 也 是 允许 的 。 这 个 包括 了 通常 只 在 低级 语言 里 面 才 会 有 的 位 操作 ， 例 

如 逻辑 “与 "。ML 的 版 本 是 安全 的 ， 它 不 允许 二 进 制 位 被 任意 地 转换 成 其 他 类 型 。 支 持 


日 ”根据 作者 的 勘误 表 : 在 翻译 这 本 书 的 时 候 ， 基 本 库 仍 在 开发 中 ， 不 过 应 该 在 2005 年 完成 。 一 一 译 者 注 
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此 类 运算 的 结构 具有 类 似 Word8 这 样 的 名 字 。 
*， 多 种 形式 的 数组 。 这 里 面包 括 了 通常 命令 式 语言 里 的 可 变更 数组 (结构 Array)， 以 及 不 
可 变数 组 (结构 Vector )。 因 为 后 者 是 不 可 更 新 的 ， 所 以 适合 销 数 式 程序 设计 。 它 们 的 初 
值 是 通过 计算 得 到 的 ， 这 些 计算 的 开销 往往 是 很 大 的 ， 因 此 不 适合 重复 地 进行 。 
。 关 于 字符 和 字符 串 的 操作 是 属于 结构 Char 和 String 的 。 而 关于 某 个 类 型 和 这 个 类 型 的 文 
字 表 示 之 间 的 转换 则 放 在 了 该 类 型 的 相关 结构 中 ， 例 如 Int。 
。 输 入 和 输出 有 几 种 支持 方式 。 主 要 的 两 种 是 传输 文本 的 文本 VO， 和 传输 任意 字 节 流 的 
二 进 制 /O。 相 关 的 结构 是 Text1O 和 Bin10。 
。 操 作 系 统 的 原 语 放 在 结构 05 中 。 它 们 都 与 文件 、 目 录 和 进程 有 关 。 其 中 也 可 能 提供 了 
相当 数量 的 其 他 操作 系统 和 输入 输出 服务 。 
* 日 期 和 时 间 的 操作 ，、 包 括 处 理 器 时 间 的 测量 功能 都 在 结构 Date、Time 和 Timer 中 。 
。 库 中 不 同 部 分 都 需要 的 那些 声明 则 集中 在 结构 General 中 。 
有 许多 其 他 的 软件 包 和 工具 包 ， 虽 然 不 在 库 中 ， 却 也 很 广泛 的 存在 。 最 终 的 运行 环境 甚至 可 
以 支持 大 多 数 茄 求 的 项 目 。 


1.9 ML 和 工作 中 的 程序 员 


CE ALAS Hy Se ZIRE. Wiener (1993) 曾 述 了 无 数 因 软 件 失 败 而 导致 的 生命 损失 、 
商业 和 危机 和 其 他 灾难 的 案例 。 软 件 产品 不 但 不 提供 使 用 保证 ， 而 且 都 附 有 免责 条 款 。 我 们 能 
通过 使 用 ML 代替 C 进 行程 序 设计 来 避免 这 些 失 败 吗 ? 当然 不 能 ， 不 过 这 可 能 是 一 个 正确 的 努 
力 方向 。 

问题 的 一 部 分 是 对 于 安全 性 的 损害 非常 普遍 。 检 测 数 组 和 引用 是 否 正确 使 用 的 代价 是 昂 
贵 的 ， 但 检测 可 以 使 得 错误 在 造成 严重 损害 之 前 就 被 发 现 。C. A. R. Hoare 曾 经 说 道 : 


een RARR: 我 们 对 结果 无 所 谓 的 调试 运行 做 大 量 精细 的 检测 ， 而 对 错误 
可 能 导致 沉重 代价 甚至 灾难 的 正式 运行 去 撞 了 这 些 检测 。 试 想 ， 一 个 航海 爱好 者 在 
干 地 上 训练 时 穿着 救生 衣 ， 一 旦 真正 下 到 海里 便 脱 掉 它 。 会 怎么 样 呢 ? (Hoare, 
1989b， 第 198 页 ) 


这 段 话 在 1973 年 的 一 个 演讲 中 第 一 次 被 提 到 后 ， 几 乎 没有 被 重视 过 。 典 型 的 编译 器 都 会 省 略 
掉 检测 ， 除 非 是 有 特别 的 命令 去 包含 它们 。C 语 言 是 非常 不 安全 的 : 像 它 的 数组 仅仅 是 个 存储 
地 址 , 检测 它们 的 使 用 正确 与 否 根本 不 现实 。 标准 C 函 数 库 包含 了 许多 可 能 会 冲垮 内 存 的 函数 ， 
它们 接受 一 个 存储 区 域 作为 参数 ， 却 不 知道 这 个 区 域 的 大 小 ! 这 样 的 后 果 就 是 : Unix 操作 系 
统 有 很 多 的 安全 漏洞 。 互 联网 蠕虫 利用 了 这 点 ， 制 造 了 大 量 的 网 络 破坏 (Spafford, 1989), 
ML 从 许多 方面 支持 可 靠 的 软件 开发 。 编 译 器 不 允许 省 略 检测 。Appel (1993) 提 到 了 ML 
的 安全 性 、 自 动 存储 分 配 和 编译 时 类 型 检测 ， 这 些 因素 合 在 一 起 能 消除 一 些 主要 的 错误 ， 并 保 
证 其 他 错误 的 早期 发 现 。Appel 同 意 函 数 式 程序 设计 是 有 价值 的 观点 ， 即 便 是 在 大 型 项 目 中 。 
此 外 ，ML 是 正式 定义 的 。Milner 等 (1990) 的 定义 并 不 是 第 一 个 正式 的 程序 设计 语言 
L, 但 它 是 第 一 个 编译 器 作者 能 看 懂 的 定义 。。 由 于 常见 的 歧义 性 没有 了 ， 因 此 编译 器 可 以 
在 很 大 的 范围 内 达到 一 致 。 新 的 标准 库 更 加 强 了 这 种 一 致 性 。 一 个 程序 不 论 用 哪个 编译 器 编 


O 这 可 能 要 感谢 程序 设计 语言 理论 的 近期 成 果 。MEL 的 定义 是 结构 化 操作 语义 的 一 个 范例 (Hennessy, 1990). 
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译 ， 都 应 该 有 相同 的 表现 ，ML 已 经 非常 接近 这 个 理想 了 。 

其 中 一 个 关键 的 长 处 就 是 ML 的 模块 系统 。 系 统 的 组 成 部 分 ， 不 论 多 大 ， 都 可 以 将 描述 和 
编码 分 开 。 每 个 组 件 都 可 以 提供 已 经 描述 好 的 服务 ， 并 且 外 界 不 能 篡改 。 组 件 可 以 将 其 他 的 
组 件 作 为 参数 ， 并 且 分 别 进 行 编译 。 这 样 的 组 件 可 以 用 很 多 种 方法 组 合 ， 配 置 出 不 同 的 系统 。 

从 软件 工程 的 角度 看 ，ML 是 一 种 适合 大 型 系统 的 优秀 语言 。 它 的 模块 让 程序 员 可 以 分 组 
工作 并 重用 组 件 。 它 的 类 型 和 总 体 的 安全 增强 了 可 靠 性 。 它 的 异常 功能 让 程序 可 以 响应 失败 。 
比较 了 ML 和 C，Appel 承 认 ML 程 序 需要 非常 多 的 空间 ， 但 运行 的 速度 却 是 可 以 接受 的 。 软 件 
开发 人 员 也 有 几 种 商业 化 的 编译 器 可 以 选择 。 

我 们 不 能 指望 短期 内 ML 程序 可 以 运行 在 电子 手表 上 。 但 是 ， 对 于 大 型 的 应 用 ， 可 靠 性 和 

程序 员 的 成 效 是 基本 的 要 素 。 是 不 是 C 的 年 代 就 要 结束 了 呢 ? 





第 2 章 ” 名字、 函数 和 类 型 


大 多 数 的 函数 式 语言 都 是 交互 式 的 。 如 果 你 输入 一 个 表达 式 ， 编 译 器 会 立刻 进行 运算 并 
给 出 结果 。 交 互 式 非 常 有 意思 ， 它 可 以 即时 反馈 ， 可 以 让 你 通过 易于 管理 的 小 部 分 代码 来 一 
点 点 地 开发 程序 。 

我 们 可 以 输入 一 个 表达 式 ， 并 以 分 号 结束 ……: 

2+2; 

aerae 然后 ML 回应 

> 4 : int 
这 里 我 们 看 到 一 些 后面 都 要 用 到 的 书写 风格 。 大 多 数 ML 系统 都 会 在 等 待 输入 的 时 候 显 示 一 个 
提示 符 ; 这 里 ,输入 是 以 打字 机 式 的 字体 显示 的 ， 回 应 则 显示 为 斜体 字 : 

> on a line like this. ` 
简单 地 说 ，ML 就 是 一 个 计算 器 。 它 有 整数 ， 像 上 面 那 样 ， 以 及 实数 。ML 可 以 进行 简单 的 算 
术 运 算 banane 


terran 还 有 平方 根 运算 : 

Math. sqrt 2.0; 

> 1.414213562 : real 
强调 一 下 ， 打 入 ML 的 任何 东西 都 要 以 分 号 (;) 结束 。ML 打 印 出 了 值 和 类 型 。 注 意 ，real 是 
实数 类 型 ， 而 in1 则 是 整数 类 型 。 

交互 式 的 程序 设计 对 于 过 程式 的 语言 来 说 更 为 困难 ， 因 为 它们 太 哪 唆 了 。 一 个 独立 的 程 
序 作为 一 次 的 输入 来 说 实在 是 太 长 了 。 


本 章 提要 


本 章 介 绍 Standard ML 和 函数 式 程序 设计 。 基 本 的 概念 包括 声明 、 简 单数 据 类 型 、 记 录 
类 型 、 递 归 销 数 和 多 态 性 。 虽 然 这 些 材料 是 以 Standard ML 来 表现 的 ， 但 是 它 叙 述 了 一 般 性 

本 章 分 为 以 下 几 节 : 

。 值 的 声明 。 用 基本 的 例子 来 介绍 值 和 函数 的 声明 。 

ok PR SFR. ABW in, real, char. stringtlbool ZER ZA, MERE 

辑 操作 。 

。 序 偶 、 元 组 和 记录 。 序 偶 和 元 组 使 函数 可 以 有 多 项 参数 和 结果 。 

。 表 达 式 的 求 值 。 严 格 求 值 和 情 性 求 值 的 区 别 不 仅仅 是 效率 ， 也 和 表达 式 的 确切 含义 相关 。 
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。 书写 递归 函数 。 举 几 个 实际 的 例子 来 讲解 递归 的 应 用 。 

。 局 部 声明 。 使 用 let 和 1ocal， 可 以 在 有 限制 的 作用 域内 声明 名 字 。 

。 模 块 系统 初步 。 签 名 和 结构 是 通过 对 于 算术 运算 操作 的 泛 化 开发 来 介绍 的 。 
。 多 态 类 型 检测 。 介 绍 了 多 态 性 的 原理 ， 包 括 类 型 推导 和 多 态 函 数 。 


值 的 声明 


声明 (declaration) 就 是 赋予 某 个 东西 一 个 名 字 。ML 里 有 许多 东西 可 以 赋予 名 字 : 值 、 
类 型 、 签 名 、 结 构 和 函 子 。 在 ML 中 大 多 数 的 名 字 代表 了 值 ， 例 如 数 、 字 符 串 以 及 函数 。 虽 然 
在 ML 里 函数 也 是 一 种 值 ， 不 过 它们 有 自己 的 声明 语法 。 


2.1 命名 常量 


任何 重要 的 值 都 是 可 以 命名 的 ， 不 论 其 重要 性 是 广泛 的 《 像 常 数 r) 或 是 暂时 的 ( 像 最 近 
一 次 计算 的 结果 )。 举 个 小 例子 ,假设 想 计算 一 小 时 里 面 有 多 少 秒 ， 可 以 先 用 名 字 seconds 代 
表 60。 


val seconds = 60; 


值 的 声明 是 以 ML 的 关键 字 va1 开 始 ， 并 以 分 号 结束 的 。 本 书 中 的 名 字 通 常用 针 体 字 表 示 。 
ML 重复 显示 一 遍 这 个 名 字 ， 以 及 它 的 值 和 类 型 : 
> val seconds = 60 : int 
我 们 再 来 定义 每 小 时 多 少 分 钟 和 每 天 多 少 小 时 这 些 常量 : 
val minutes = 60; 
> val minutes = 60 : int 
val hours = 24; 
> val hours = 24 : int 
现在 这 些 名 字 就 可 以 用 在 表达 式 里 面 了 : 


seconds* minutes* hours ; 
> 86400 : int 


如 果 你 像 上 面 这 样 在 (运行 环境 的 ) 顶层 输入 一 个 表达 式 ，ML 把 求 得 的 值 存 和 名字 it。 通 过 
引用 it， 你 可 以 将 该 值 用 在 后 面 的 计算 中 : 9 

it div 24; 

> 3600 : int 
名 字 if 里 总 是 放 着 最 近 一 次 在 顶层 输入 的 表达 式 的 值 。 任 何 之 前 i 的 值 都 被 丢弃 了 。 想 要 保留 
iH, ， 就 要 声明 一 个 永久 的 名 字 : 

val secsinhour = it; 

> val secsinhour = 3600 : int 


顺便 提 一 下 ， 名 字 里 面 可 以 包含 下 划 线 ， 这 样 看 起 来 更 清楚 : 


val secs.inhour = seconds* minutes; 
> val secs_in_hour = 3600 : int 


日 SML/NJ 和 其 他 一 些 编译 器 在 回应 计算 结果 的 时 候 会 显示 诸如 val it = 3600 : int, 不 过 这 里 仍 采 用 原 书写 法 。 
作者 并 没 表示 示 范 代码 属于 某 个 特定 的 编译 器 。 一 一 译 者 注 
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为 了 演示 一 下 实数 ， 我 们 通过 公式 area = wr" 来 计算 半径 为 ?的 圆 面积 : 


val pi = 3.14159; 
> val pi = 3.14159 : real 


val r= 2.0; 
> val r = 2.0 : real 
val area = pi *r*rT; 


> val area = 12.56636 : real 


2.2 声明 函数 
计算 圆 面积 的 公式 可 以 像 下 面 这 样 写 成 ML 的 函数 : 
fun area (r) = pi*r*r; 


函数 声明 以 关键 字 fun 开 始 ， 而 area 是 函数 的 名 字 ，r 是 形式 参数 (formal parameter), 
Pixrxr 则 是 函数 体 〈body)。 函 数 体 里 面 引 用 了 r 和 上 面 声明 的 常量 户 。 

因为 函数 在 ML 里 面 也 是 值 ， 函 数 声 明 就 是 值 声明 的 一 种 形式 ， 所 以 ML 也 打印 了 值 和 
类 型 : 

> val area = fn : real -> real 
这 个 类 型 用 正规 的 数学 记 法 是 real -~ real， 表 示 area 以 一 个 实数 作为 参数 并 返回 另 一 个 实数 。 
函数 的 值 表示 为 fn。 和 大 多 数 函 数 式 语言 一 样 ，ML 里 的 函数 也 是 一 种 抽象 值 ， 它 们 的 内 部 结 
构 是 隐藏 的 。 

让 我 们 调用 一 下 函数 ， 重 复 上面 做 过 的 面积 计算 : 


area(2.0); 
> 12.56636 : real 


我 们 再 试 试 别 的 参数 ， 注 意 参 数 外 面 的 括号 是 可 选 的 : 


area 1.0; 
> 3.14159 : real 


函数 声明 里 插 号 也 是 可 选 的 。 下 面 的 area 的 函数 声明 和 之 前 的 等 价 : 。 

fun area r = pi*r*r; 
PAY FAS ACB at Fe Zs FED ET FE 

注释 。 程 序 员 们 常常 认为 他 们 的 作品 太 清晰 了 ， 不 需要 更 多 的 描述 。 逻 辑 的 清晰 对 其 他 
人 来 说 并 不 明显 ， 除 非 程序 注释 得 很 恰当 。 注 释 可 以 描述 声明 的 目的 ， 可 以 给 出 文字 上 的 参 
考 ， 或 是 解释 昨 雇 的 问题 。 当 然 ， 注 释 一 定 要 是 正确 而 不 过 时 的 。 

ML 里 面 的 注释 由 (* 开 始 ， 以 拉 结 束 ， 并 且 可 以 跨越 数 行 。 注 释 甚 至 可 以 嵌 套 。 它 们 几乎 
可 以 被 桂 入 在 任何 地 方 : 


O 在 几乎 所 有 的 函数 式 程序 设计 中 ， 参 数 外 面 的 括号 习惯 上 是 不 用 的 ， 这 一 点 和 过 程式 语言 很 不 一 样 。 函 数 
调用 在 这 里 也 习惯 称 为 函数 应 用 《〈fanction application ) ， 意 思 是 将 函数 应 用 到 实际 参数 上 ， 而 调用 一 词 会 
给 人 留 下 程序 运行 这 样 的 过 程式 语言 的 印象 。 因 为 函数 应 用 是 函数 式 语 言 的 主要 操作 ， 所 以 它 采 用 最 省 事 
的 写法 : ja。 后面 讲 到 参数 的 柯 里 化 时 也 会 看 到 这 种 记 法 的 好 处 。 国 数 式 语言 因此 也 称 为 应 用 式 
(applicative) 诺言 ， 不 过 后 来 这 个 词 被 大 多 用 作 与 声明 式 (declarative) 同 义 、 而 与 命令 式 (imperative) 
相对 了 。 译 者 注 
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fun area r = (* 半 径 为 :的 圆 的 面积 *) 
pi*r*r; 
函数 式 的 程序 员 不 应 该 觉得 可 以 免 去 书写 注释 。 人 们 还 曾经 宜 称 Pascal 是 自 成 文档 的 语 
名 字 的 重新 声明 。 值 的 名 字 称 作 变 量 (variable )。 和 命令 式 语言 里 面 的 变量 不 同 ， 这 里 的 
变量 是 不 能 更 新 的 。 不 过 一 个 名 字 可 以 被 重新 用 作 其 他 的 用 途 。 如 果 一 个 名 字 被 再 次 声明 ， 那 
么 新 的 含义 将 在 之 后 被 采用 ,但 不 会 影响 现 有 的 对 这 个 名 字 的 使 用 。 让 我 们 重新 声明 常量 pi: 


val pi = 0.0; 
> val pi = 0.0: real 


我 们 可 以 看 到 area 仍 然 使 用 户 原 先 的 值 : 
.Crea(1.0) 
> 3.14159 : real 
到 了 这 个 阶段 ， 几 个 变量 都 有 了 值 。 包 括 segonds、minutes、area 和 pi， 以 及 库 里 面 提供 的 内 
置 操 作 。 在 所 有 地 方 都 可 以 看 到 的 这 些 绑 定 9 被 称 作 环 境 (environment)。 销 数 area 引 1 用 了 一 
个 较 早 的 环境 ， 在 那里 pi 代表 3.14159。 这 要 感谢 名 字 的 永久 性 ( 称 作 静态 绑 定 ，static 
binding )， 重 新 声明 一 个 名 字 不 会 损坏 系统 、 库 或 是 你 的 程序 。 


A 修改 你 的 程序 。 由 于 静态 绑 定 ， 重 新 声明 你 的 程序 所 调用 的 函数 可 能 没有 任何 
作用 。 当 修改 程序 的 时 候 ， 要 保证 把 整个 文件 再 编译 一 遍 。 大 程序 应 该 分 成 模块， 
将 在 第 7 章 详 述 。 在 修改 过 的 模块 重新 编译 以 后 ， 整 个 程序 仅 需 要 重新 连接 。 


2.3 Standard ML 中 的 标识 符 


一 个 字母 名 字 (alphabetic name) 必须 以 字母 开始 ， 后 面 则 可 以 跟随 任意 数目 的 字母 、 数 
字 、 下 划 线 (_) RE ('))， 通 常 也 叫做 单 引号 。 例 如 : 


x UB40 Hamlet_Prince_of_Denmark h’'’3_H 
大 小 写 是 有 区 别 的 ， 所 以 q 和 Q 不 同 。 人 允许 撒 号 是 因为 ML 是 数学 家 们 设计 的 ， 他 们 喜欢 把 变量 
叫做 zx、x'、x"。 在 选择 名 字 的 时 候 ， 要 确定 避免 使 用 ML 的 关键 字 : 


abstype and andalso as case datatype do 
else end eqtype exception fn fun functor 
handle if in include infix infixr let local 
nonfix of op open orelse raise rec 

sharing sig signature struct structure 
then type val where while with withtype 


特别 是 注意 那些 短 的 关键 字 : as. fn. if. in, of. op. 
ML 也 允许 用 符号 名 字 (symbolic name)。 这 些 名 字 由 下 面 的 字符 组 成 : 
1g%&S#+-*/:<=>?e8e\ ”| 


由 这 些 字 符 组 成 的 名 字 可 以 任意 长 : 


日 PE (binding): AF (变量 ) 和 值 的 结合 。 一 一 译 者 注 
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一 ~ 一 一 > SS SS 112Q@xx?211 -= | ==>-> ># 
某 些 特殊 字符 组 成 的 串 是 为 ML 的 语法 所 保留 的 ， 它 们 不 能 被 用 作 符 号 名 字 
| = => -> # :> 


是 字母 名 字 可 以 出 现 的 地 方 ， 符 号 名 字 也 可 以 出 现 

val +-+-+ = 1415; 

> val +-+-+ = 1415 : int 
名 字 更 为 正式 的 称呼 是 标识 符 〈identifier)。 标 识 符 可 以 同时 表示 值 、 结 构 、 签 名 、 国 子 和 记 
录 域 。 
练习 2.1 在 你 的 计算 机 系统 上 学 习 怎 样 开始 和 结束 一 个 ML 会 话 。 然 后 学 习 怎 样 让 ML 编译 器 
从 文件 里 面 读 入 声明 、 一 个 典型 的 命令 就 是 use "myfile"。 


数 、 字 符 串 和 真 值 


ML 里 最 简单 的 值 就 是 整数 和 实数 、 字 符 串 和 字符 以 及 布尔 值 或 真 值 。 这 一 市 介绍 这 些 类 
型 和 它们 的 常量 以 及 基本 操作 。 


2.4 算术 运算 


ML 区 分 整数 (KWin) 和 实数 (类 型 real)。 整 数 算术 是 精确 的 (有 些 ML 系统 里 面 支持 
无 限 的 精度 )， 而 实数 算术 只 能 像 计算 机 里 面 的 浮 点 数 硬件 那样 精确 。 

整数 。 一 个 整数 常量 是 一 串 数字 ， 有 可 能 以 一 个 负 号 (~) 开始 。 例 如 : 

0 723 01234 ~85601435654678 


整数 运算 包括 了 加 法 (+) WE (-)、 乘 法 (* )、 除 法 (div) 和 取 模 (mod)。 这 些 都 是 中 
缀 运算 符 ， 它 们 遵循 常规 的 优先 级 : 因此 在 

(( (m*n)*k) - (m div j)) +j 
这 个 式 子 里 面 ， 所 有 的 括号 都 是 可 以 去 掉 的 ， 而 含义 不 变 。 

实数 。 一 个 实数 常量 包含 一 个 小 数 点 或 者 B 记 法 ， 或 者 两 者 都 有 。 例 如 : 

0.01 2.718281828 “1.2E12 7E75 
结尾 En 的 意思 是 “ 乘 以 10 的 "次 方 "。 负 的 指数 部 分 是 以 一 元 减 号 (~) 开始 的 。 这 样 的 话 
123 .4E 2 就 表示 1.234。 

、 负 实数 以 一 元 减 号 (~) 开始。 实数 的 中 缀 运算 符 包括 加 法 (+)、 减 法 〈-)、 乘 法 〈* ) 

和 除法 (/)。 函 数 应 用 比 中 组 运算 符 优先 级 更 高 。 例 如 ，area a + b 等 价 于 (area a) + b， 而 不 


是 area (a + b)。 


A 一 元 加 号 和 减 号 。 一 元 减 号 是 一 个 否定 号 (~)。 不 要 将 它 和 减 号 (一) HR! 

ML 里 面 没有 一 元 的 加 号 。+ 和 -都 不 能 出 现在 实数 的 指数 部 分 。 

类 型 约束 。ML 可 以 根据 表达 式 里 面 用 到 的 函数 和 常量 的 类 型 推导 出 大 多 数 表 达 式 的 类 型 。 
ASHE BH) EEE BH (overloaded) 了 的 ， 它 们 不 止 有 一 个 含义 。 例 如 ，+ 和 * 对 于 
整数 和 实数 中 都 有 定义 。 重 载 函 数 的 类 型 必须 由 上 下 文 来 确定 ， 偶 尔 必 须 显 式 地 指出 。 





18 Z2E 
例如 ，ML 不 能 确定 这 个 平方 的 函数 是 给 整数 用 的 ， 还 是 实数 用 的 ， 因 此 拒绝 接受 这 样 的 
声明 。 


fun square x = x*x; 
> Error~ Unable to resolve overloading for * 


假设 函数 是 针对 实数 的 。 我 们 可 以 在 几 个 地 方 插 入 类 型 real。 
我 们 可 以 指定 参数 的 类 型 : 


fun square(x : real) = x*x; 
> val square = fn : real -> real 


也 可 以 指定 结果 的 类 型 : 


fun square x : real = x*x; 
> val square = fn : real -> real 


同样 ， 我 们 可 以 指定 函数 体 的 类 型 : 


fun square x = x*x : real; 
> val square = fn : real -> real 


类 型 约束 也 可 以 出 现在 函数 体内 部 ， 实 际 上 几乎 任何 地 方 都 可 以 。 


A 获 认 重 载 。 标 准 库 引 入 了 默认 重 载 的 记 法 ， 编 译 器 可 以 通过 选择 类 型 int 来 解决 
Square 的 歧义 。 在 这 种 情况 下 使 用 类 型 约束 也 是 有 益 的 ， 这 增加 了 清晰 性 。 默 认 重 载 
的 初 袁 是 允许 不 同 精度 的 数 同时 存在 。 例 如 ， 除 非 1.23 的 精度 可 以 从 上 下 文 确定 ， 
否则 就 将 以 默认 精度 的 实数 来 表示 。 在 写 这 本 书 的 时 候 ， 还 没有 遇 到 过 不 同 精度 的 
数 的 表示 ， 但 是 这 方面 的 考虑 是 必要 的 。 


O 并 术 运 算 和 标准 库 。 标 准 库 包 括 了 很 多 不 同 精度 的 整数 和 实数 的 函数 。 结 构 Imi 
包括 了 类 似 abs (#311), min, maxfosign® BK, EA EF: 
Int.abs ~4; 
> 4; int 
Int.min(7, Int.sign 12); 
> 1 : int 

结构 Readl 包 爹 了 类 似 的 函数 ， 比 如 abs 和 si8gm， 以 及 用 于 在 整数 和 实数 之 间 转 换 
的 函数 。 调 用 real( 门 将 ;转换 为 等 值 的 实数 。 调 用 roxnad(r) 将 r 转 换 为 值 最 接近 的 整数 。 
其 他 实数 到 整数 的 转换 还 包括 Poor、ceil 和 trunc。 每 当 整 数 和 实数 出 现在 同一 个 表达 
式 里 时 就 需要 使 用 转 挽 滨 数 了 。 

结构 Math 包 含 了 有 关 实 数 的 更 高 级 的 数学 函数 ， 比 如 sgrf、sin、cos、datan (A 
正切 )、exp 和 In (自然 对 数 )。 每 个 函数 都 是 以 一 个 实数 为 参数 ， 并 返回 实数 类 型 的 
结果 。 


练习 2.2 一 个 Lisp 黑 客 说 过 : “由 于 整数 是 实数 的 子 集 ， 它 们 之 间 的 区 别 完 全 是 人 为 的 ， 是 那 
些 硬 件 设 计 者 强加 于 我 们 的 。ML 应 该 简单 得 只 提供 数 ， 就 像 Lisp 那 样 ， 自 动 选 择 合适 的 整数 
或 实数 。 ”你 同意 吗 ? 出 于 什么 样 的 考虑 呢 ? 


练习 2.3 下 面 哪些 函数 需要 类 型 约束 ? 
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fun double(n) = 2*n; 
fun f u = Math.sin(u)/u; 
fun gk = ~ k * k; 


25 字符 串 和 字符 


消息 和 其 他 文本 都 是 字符 组 成 的 串 。 它 们 的 类 型 是 string。 字 符 串 常量 是 用 双 引 号 括 起 
来 的 : 

"How now! a rat? Dead, for a ducat, dead!"; 

> "How now! a rat? Dead, for a ducat, dead!” : string 


连接 操作 符 (“) 将 两 个 字符 串 首 尾 相 接 : 
"Fair " ^ "Ophelia"; 
> "Fair Ophelia" : string 
内 置 国 数 size 返 回 一 个 字符 串 里 面 的 字符 个 数 。 这 里 i 是 指 "Fair Ophelia": 
size (it); 
> 12 : int 
里 面 的 空格 当然 也 算 。 人 size("") 是 0。 
下 面 的 函数 给 名 字 加 上 一 贵族 头衔 : 


fun title(name) = "The Duke of " ^ name; 
> val title = fn : string -> string 
title "York"; 

> "The Duke of York" : string 


特殊 字符 。 由 一 个 反 斜 线 开 始 的 转 义 序列 (escape sequence) 可 以 将 某 些 特殊 字符 插入 到 
字符 串 中 。 这 里 列 出 一 些 : 

o\n 插入 一 个 换行 符 。 

“\ 插入 一 个 制 表 符 。 

eV 插入 一 个 双 引 号 。 

。N\ 播 入 一 个 反 斜 线 。 

°\ 之 后 紧 跟 一 个 换行 和 其 他 空白 字符 ， 然 后 再 跟 一 个 \ 则 不 插入 任何 字符 、 不 过 在 换行 之 

后 续 写 同一 个 字符 串 。 

下 面 是 一 个 包含 换行 符 的 字符 串 : 


"This above all:\nto thine own self be true\n"; 

字符 类 型 。 就 像 数字 3 和 集合 {3} 的 区 别 那样 ， 一 个 字符 不 同 于 只 包含 一 个 字符 的 字符 串 。 
字符 具有 char 类 型 。 它 的 常量 形 如 #s ，* 则 是 只 有 一 个 字符 的 字符 串 常量 。 下 面 定义 了 一 个 字 
母 、 一 个 空格 和 一 个 特殊 字符 : 

#"a" #" " #"\n" 
消 数 ord 和 chr 将 字符 和 字符 码 互相 转 换 。 大 多 数 实现 都 是 使 用 ASCII 字 符 集 ， 如 果 0 < k< 255, 
那么 chpr( 旭 返回 一 个 以 上 为 字符 码 的 字符 。 相应 地 ，ord(c) 返 回 字符 c 的 字符 码 。 我 们 可 以 利用 
这 些 来 将 0 到 9 之 间 的 数 转换 成 #"0" 到 #"9" 之 间 的 字符 : 
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fun digit i = chr(i + ord #"0"); 

> val digit = fn : int -> char 
PAK str#String .sab 将 字符 和 字符 串 互相 转换 。 如 果 c 是 一 个 字符 的 话 ，str(c) 则 是 相对 应 的 字 
符 串 。 相 应 地 ， 如 果 * 是 一 个 字符 串 的 话 ， 那 么 String .sub(s, n) 则 返回 里面 的 第 n 个 字符 ， 从 
零 开 始 计数 。 让 我 们 试 着 用 另 一 种 方式 表达 函数 digi: 

fun digit i = String.sub("0123456789", i); 

> val digit = fn : int -> char 

str (digit 5); 

> "5" : string 

第 二 个 digit 的 定义 比 第 一 个 更 可 取 ， 因 为 它 不 依赖 于 字符 的 编码 方式 。 

O 字 竺 早 、 字 符 和 标准 库 。 结 构 String 包 含 了 很 多 关于 字符 囊 的 操作 。 结 构 Char 提 
供 了 诸如 isDigit、ishAlpha 之 类 的 判定 字符 类 别 的 函数 。 子 事 (substring) AFH FE 
面 的 连续 的 字符 子 序 列 ， 结 构 Substring 提 供 了 提取 和 处 理 它们 的 操作 。 

ML 的 定义 (Milner 等 ，1990) 里 面 只 有 字符 串 类 型 。 标 准 库 引 入 了 字符 类 型 。 
标准 库 同 时 修改 了 一 些 内 置 函 数 的 类 型 ， 比 如 ord 和 cjir， 它 们 以 前 是 对 只 有 一 个 字符 
的 字符 串 进 行 操 作 的 。 


练习 2.4 对 于 digit 的 两 个 版 本 ， 你 觉得 调用 digir1 和 digir LOMAS AMR? 在 上 机 实 
验 之 前 试 着 预测 一 下 。 


2.6 真 值 和 条 件 表达 式 


为 了 通过 分 情 来 定义 函数 ， 也 就 是 说 欧 数 的 结果 取决 于 测试 的 结果 ， 我 们 引入 条 件 表达 
式 。。 测 试 就 是 一 个 类 型 为 ool 的 表达 式 E， 取 值 可 以 是 true (A) 和 /alse ( 假 )。 测试 的 结果 
用 于 在 两 个 表达 式 已 或 已 中 选择 其 一 。 条 件 表 达 式 


if E then E, else E 


VA REIRE, BES Trruett, AE, MAES false}, AE, elseM@aUAFE. 

最 简单 的 测试 是 关系 运算 : 

“小 于 (<) 

“大 于 (>) 

“小 于 或 等 于 (<=) 

“大 于 或 等 于 (>=) 
这 些 关系 在 整数 和 实数 上 都 有 定义 ， 它 们 也 可 以 按 字母 顺序 测试 字符 串 和 字符 的 大 小 。 这 样 
一 来 ， 关 系 运算 就 被 重 载 了 ， 有 可 能 需要 类 型 约束 。 相 等 (=) 和 不 相等 (<>) 对 于 大 多 数 
类 型 都 可 以 进行 测试 。 

例如 ， 函 数 sign 计 算 一 个 整数 的 符号 (1、0 或 -1)。 它 包括 两 个 条 件 表达 式 和 一 条 注释 。 

fun sign(n) = 


if n>0 then 1 
else if n=0 then 0 


© 因为 Standard ML 的 表达 式 可 以 改变 状态 ， 条 件 表达 式 可 以 像 过 程式 语言 的 i£ 命 令 一 样 使 用 。 
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else (*n<0*) “1; 

> val sign = fn : int ->int 
测试 可 以 通过 ML 的 布尔 运算 进行 组 合 : 

ita (orelse) 

° 48 '5 (andalso) 

。 逻辑 非 ( 函数 not) 
返回 布尔 值 的 函数 也 叫做 谓词 (predicate )。 下 面 是 一 个 测试 作为 其 参数 的 字符 是 不 是 小 写字 
母 的 谓词 : 

fun isLower c = #"a" <= c andalso c <= #"z"; 

> val isLower = fn : char -> bool 


当 对 条 件 表达 式 求 值 时 ， 要 么 then 表 达 式 被 求 值 ， 要 么 else 表 达 式 被 求 值 ， 但 它们 从 不 会 
同时 被 求 值 。 布 尔 操作 符 andalso 和 orelse 不 同 于 普通 的 函数 : 第 二 个 操作 数 只 是 在 需要 
的 时 候 才 会 被 求 值 。 它 们 的 名 字 反 映 了 这 种 顺序 性 的 行为 。 

练习 2.5 ”假设 4 是 一 个 整数 且 m 是 一 个 字符 串 。 书 写 一 个 ML 的 布尔 表达 式 ， 当 且 仅 当 d 和 mm 组 
成 一 个 有 效 的 日 期 时 为 真 : 比如 25 和 "Ooctober"。 假 设 不 在 阔 年 里 。 


序 偶 、 元 组 和 记录 


在 数学 里 ， 几 个 值 集 成 在 一 起 通常 也 看 作 是 一 个 值 。 二 维 空间 中 的 一 个 向 量 是 一 个 有 序 
的 实数 对 。 一 个 关于 两 个 向 量 和 总 的 语句 也 可 以 换 作 一 个 关于 四 个 实数 的 语句 ， 共 至 那些 
实数 本 身 也 可 以 再 分 割 成 更 小 的 部 分 ， 但 是 在 高 的 层次 思考 会 容易 一 点 。 书 写 nt EEE 
B(x + 总 ,六 +y) 更 省 事 。 

日 期 是 个 更 为 普通 的 例子 。 像 25 October 1415 这 样 的 日 期 由 三 个 值 组 成 。 把 它 作 为 一 个 
整体 看 ， 则 是 一 个 形 如 (day, month, year) 的 三 元 组 。 这 个 基本 概念 经 过 了 相当 长 的 时 间 才 出 现 
在 程序 设计 语言 中 ， 并 且 仅 有 几 种 能 恰当 地 处 理 它 。 

Standard ML 提供 了 序 偶 (二 元 组 )、 三 元 组 、 四 元 组 等 。 在 n> 2 时 ，n 个 值 的 有 序 集成 被 
称 为 元 组 ， 或 简称 元 组 (tuple)。 分 量 为 Xi, X s x, 的 元 组 书写 成 (x1, X2 .…, Xxn)。 这 样 的 值 是 
由 形 如 (E1, Fo, .…, 5,) 的 表达 式 建 立 的 。 通 过 元 组 ， 函 数 可 以 有 多 个 参数 和 多 个 结果 。 

MEL 元 组 的 分 量 本 身 也 可 以 是 元 组 或 任何 其 他 的 值 。 例 如 ， 一 段 时 间 可 以 通过 日 期 的 序 偶 
来 表达 ， 而 不 管 日 期 是 如 何 表示 的 。 另 外 ， 储 套 的 序 偶 也 可 以 表示 mn 元 组 。( 在 Classic ML 这 
个 最 原始 的 变种 中 i, oe Xn Xn) ADEE, -s (Xn-1, xz)…) 的 简写 。) 

ML 记录 (record) 的 分 量 是 由 标识 符 确 定 的 ， 而 不 是 由 位 置 确定 的 。 一 个 有 20 个 分 量 的 
记录 打印 出 来 要 占 很 大 的 地 方 ， 不 过 它 要 比 20 元 组 容易 管理 。 


2.7 向 量 : 序 偶 的 例子 


我 们 来 书写 几 个 关于 向 量 的 例子 。 想 要 试验 序 偶 的 语法 ， 可 以 输入 向 量 (2.5, -1.2): 

(2.5, ~1.2); 

> (2.5, “1.2) : real * real 
这 个 向 量 类 型 的 数学 写法 是 real x real， 也 就 是 实数 序 偶 的 类 型 。 向 量 是 ML 里 的 值 ， 也 可 以 
赋予 名 字 。 下 面 声 明 零 向 量 以 及 其 他 两 个 向 量 a 和 1b: 
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val zerovec = (0.0, 0.0); 


> val zerovec = (0.0, 0.0) : real * real 
val a = (1.5, 6.8); 

> val a = (1.5, 6.8) : real * real 

val b = (3.6, 0.9); 


> val b = (3.6, 0.9) : real * real 


许多 关于 向 量 的 函数 都 是 在 其 分 量 上 操作 的 。(x, y) 的 长 度 是 Vx +y ， 而 它 的 反 向 量 是 (~x， 
-y)。 在 ML 里 面 编写 这 些 函 数 ， 只 要 简单 地 将 参数 写成 一 个 模式 : 

fun lengthvec (x,y) = Math.sqri (x*x + y*y); 

> val lengthvec = fn : real * real -> real 
函数 lengthvec 以 x 和 y 组 成 的 序 偶 作 为 参数 。 它 具有 类 型 real x real> real: ‘CMBR RRIF 
偶 ， 而 结果 则 是 另 一 个 实数 。。 下 面 的 a 是 刚才 声明 过 的 实数 序 偶 。 

lengthvec a; 

> 6.963476143 : real 


lengthvec (1.0, 1.0); 
> 1.414213562 : real 


函数 negvec 相 对 于 原点 (0,0) 反 转 一 个 向 量 。 

fun negvec (x,y) : real*real = (~x, “y); 

> val negvec = fn : real * real -> real * real 
这 个 函数 的 类 型 是 real x real> real x real: 给 定 一 个 实数 序 偶 返 回 另 一 个 序 偶 。 因 为 负 号 (~) 
是 被 重 载 的 ， 所 以 类 型 约束 real x real 是 必需 的 。 

我 们 反 转 一 些 向 量 ， 并 给 5 的 反 向 量 命名 : 

negvec (1.0, 1.0); 

> (71.0, ~1.0) : real * real 

val bn = negvec(b); 

> val bn = (73.6, ~0.9) : real * real 
向 量 可 以 是 函数 的 参数 和 结果 ， 也 可 以 命名 。 总 的 来 说 ， 它 们 拥有 和 ML 中 内 置 类 型 (比如 整 
数 ) 完全 一 样 的 权利 。 我 们 甚至 可 以 声明 一 个 向 量 类 型 : 

type vec = real*real; 

> type vec 
现在 vec 就 是 real x reaj 的 缩写 。 它 也 只 是 一 个 缩写 : 所 用 实数 序 偶 的 类 型 都 是 vec， 不 管 该 序 
偶 是 不 是 为 了 表示 一 个 向 量 。 我 们 可 以 使 用 vec 作 为 类 型 约束 。 


2.8 多 参数 和 多 结果 的 函数 


下 面 是 计算 两 个 实数 平均 值 的 函数 。 
fun average(x,y) = (x+y)/2.0; 
> val average = fn : (real * real) -> real 


对 一 个 向 量 做 这 件 事 是 很 奇怪 的 ， 不 过 average 对 任何 两 个 ( 实 ) 数 都 起 作用 : 


average (3.1,3.3); 
> 3.2 : real 


日 ”函数 Math.sqrt 只 对 实数 定义 ， 因 此 约束 了 被 重 载 的 运算 符 ， 使 其 必须 是 实数 类 型 的 。 
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一 个 在 序 偶 上 定义 的 函数 其 实 就 是 一 个 具有 两 个 参数 的 国 数 : lengthvec(x, y)Flaverage(x, y) 
操作 在 实数 x 和 y 上 。 是 否 将 (x, y) 看 作 向 量 完全 取决 于 我 们 自己 。 类 似 地 ，negvec 有 两 个 参数 ， 
并 返回 两 个 结果 。 

严格 地 说 、 每 个 ML 函数 只 有 一 个 参数 和 一 个 返回 结果 。 利 用 元 组 ， 函 数 可 以 有 任意 多 个 
参数 ， 以 及 返回 任意 多 个 结果 。 

由 于 一 个 元 组 的 分 量 本 身 也 可 以 是 一 个 元 组 ， 所 以 两 个 向 量 可 以 竣 成 一 对 : 

((2.0, 3.5), zerovec); 

> ((2.0, 3.5), (0.0, 0.0)) : (real*real) * (real*real) 
AAE, yV 六 ) 的 和 向 量 是 Ce + x, yi + y)。 在 ML 里 ， 这 个 函数 以 一 对 向 量 为 参数 。 
它 的 参数 模式 是 一 对 序 偶 : 


fun addvec ((xl,yl}, (x2,y2)) : vec = (xl+x2, yl+y2); 
> val addvec = fn : (real*real) * (real*real) -> vec 


类 型 vec 首 次 出 现 了 ,约束 了 加 法 ,使 其 必须 作用 在 实数 上 。ML 给 出 了 addvec 类 型 
((real x real) x (real x real)) —> vec 


这 等 价 于 更 为 简练 的 写法 (vec x vec) -vec。ML 系 统 不 可 能 将 所 有 的 real x real 都 简化 成 vec。 
再 来 看 看 addvec 的 参数 模式 。 我 们 可 以 等 价 地 将 这 个 函数 的 参数 看 作 
。 一 个 参数 : 实数 序 偶 的 序 偶 。 
。 两 个 参数 : 每 个 都 是 一 个 实数 序 偶 。 
"四 个 参数 : 全 都 是 实数 ， 莫 名 其 妙 地 分 成 两 组 。 
下 面 我 们 将 向 量 (8.9, 4.4) 和 45 加 起 来 ， 然 后 把 结果 和 另 一 个 向 量 再 加 起 来 。 留 意 一 下 ， 函 数 的 
结果 类 型 是 vec。 
addvec((8.9, 4.4), b); 
> (12.5, 5.3) : vec 


addvec(it, (0.1, 0.2)); 
> (12.6, 5.5) : vec 


向 量 的 减法 涉及 到 分 量 的 相 减 ， 但 也 可 以 通过 其 他 向 量 操作 来 表示 : 
fun subvec(vl,v2) = addvec(vl, negvec v2); `- 
> val subvec = fn : (real*real) * (real*real) -> vec 


变量 v1 和 v2 都 在 实数 序 偶 的 范围 内 取 值 。 
subvec (a,b); 
> (72.1, 5.9) : vec 


两 个 向 量 的 距离 就 是 两 个 向 量 差 的 长 度 : 


fun distance(vl,v2) = lengthvec (subvec (vl ,v2)); 
> val distance = fn : (real*real) * (real*real) -> real 


由 于 distance 不 会 分 开 使 用 v1 和 v2， 所 以 它 可 以 简化 为 : 


fun distance pairv = lengthvec (subvec pairv) ; 


变量 pairv 在 向 量 序 偶 的 范围 内 取 值 。 这 个 版 本 看 上 去 可 能 有 点 奇怪 ， 不 过 确实 和 之 前 的 版 本 
等 价 。a 到 b 有 多 远 呢 ? 
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distance (a,b); 
> 6.262587325 : real 


最 后 一 个 例子 将 说 明 序 偶 的 分 量 可 以 是 不 同类 型 的 : 这 里 是 一 个 实数 和 一 个 向 量 。 缩 放 一 个 
向 量 就 是 将 两 个 分 量 乘 以 同一 个 常量 。 

fun scalevec (r, (x,y)) : vec = (r*x, r*y); 

> val scalevec = fn : real * (real*real) -> vec 
同样 ， 类 型 约束 vec 保 证 乘法 是 作用 在 实数 上 的 。 函 数 scalevec 以 一 个 实数 和 一 个 向 量 为 参数 ， 
并 返回 一 个 向 量 。 

scalevec(2.0, a); 

> (3.0, 13.6) : vec 


scalevec(2.0, it); 
> (6.0, 27.2) : vec 


选择 元 组 的 分 量 。 在 一 个 模式 上 ， 比 如 (x, y)， 定 义 的 函数 通过 模式 变量 x 和 y 来 引用 参数 
里 面 的 分 量 。val 声 明 也 可 以 将 值 和 模式 匹配 : 每 一 个 模式 中 的 变量 将 指向 相应 的 分 量 。 

下 面 我 们 把 scalevec 看 作 是 返回 两 个 结果 的 函数 ， 这 两 个 结果 分 别 命 名 为 xc 和 yc。 

val (xc,yc) = scalevec(4.0, a); 

> val xc = 6.0 : real 

> val yc = 27.2 : real 
val 声 明 里 的 模式 可 以 和 函数 定义 里 的 参数 模式 一 样 复杂 。 在 下 面 这 个 特意 构造 的 例子 里 ， 
一 个 序 偶 的 序 偶 被 分 解 成 四 个 部 分 ， 每 个 部 分 都 给 予 命名 。 


val ((xl,yl), (x2,y2)) = (addvec(a,b), subvec(a,b)); 
> val x1 = 5.1: real 
> val yl = 7.7 : real 
> val x2 = 72.1 : real 
> val y2 = 5.9 : real 


替 元 组 和 单元 类 型 unit。 之 前 我 们 只 考虑 n> 2 的 n 元 组 。 也 存在 零 元 组 ， 写 作 0 并 读 做 
“单元 ”(unity )， 它 没有 分 量 。 它 的 用 途 在 于 ， 当 没有 数据 需要 传输 的 时 候 提供 一 个 占 位 符 。 
零 元 组 是 unit 类 型 里 唯一 的 一 个 值 。 

unit 类 型 经 常用 于 ML 中 的 过 程式 程序 设计 。 过 程 就 是 返回 值 类 型 为 unit 类 型 的 “函数 ”。 
过 程 的 调用 是 为 了 看 到 它 的 作用 一 一 而 不 是 得 到 它 的 值 ， 反 正 值 总 是 ()。 例 如 ， 一 些 ML 系 统 
提供 一 个 类 型 为 string > unit 的 冰 数 use。 调 用 use "myfile" 的 作用 是 将 文件 "myfile" 里 面 的 
定义 读 人 ML。 

参数 类 型 是 unit 的 函数 在 调用 时 不 能 给 函数 体 传递 任何 信息 。 调 用 这 样 的 函数 只 不 过 是 将 
国 数 体 进行 求 值 。 在 第 5 章 ， 这 样 的 函数 被 用 在 延 时 求 值 上 ， 可 以 实现 无 穷 表 的 程序 设计 。 
练习 2.6 ”书写 一 个 函数 来 判断 一 天 之 内 的 某 个 时 间 ， 形 如 (hour, minute, AM 或 PM) ， 是 否 在 
男 一 个 时 间 之 前 。 例 如 ， 判 断 (11，59，"AM") 是 否 在 (1，15，"PM") 之 前 。 
练习 2.7 上 古老 的 英国 钱币 是 12 便 士 为 一 先 令 ， 且 20 先 令 为 一 英镑 。 写 一 些 函 数 ， 利 用 三 元 组 
(pounds, shillings, pence) 来 加 减 两 个 钱 数 。 


2.9 记录 
记录 是 一 种 其 分 量 一 一 称 作 域 (field) 一 一 具有 标签 的 元 组 。 一 个 "元 组 的 每 个 分 量 是 由 
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它 所 在 的 位 置 ， 从 1 到 n， 来 标识 的 ， 而 记录 里 的 域 却 可 以 以 任意 顺序 出 现 。 调 换 一 个 元 组 的 
分 量 通常 会 导致 错误 。 如 果 雇 员 是 由 元 组 (aame, age, salary) 来 表示 的 话 ，("Jones"，25， 
15300) 和 ("Jones"，15300，25) 的 区 别 就 大 了 。 但 是 ， 记 录 


{name=" Jones", age=25, salary=15300} 


和 


{name="Jones", salary=15300, age=25} 


是 一 样 的 。 记 录 是 由 花 括号 括 起 来 的 ， 每 个 域 都 形 如 label = expression. 
记录 适用 于 多 个 分 量 的 情况 。 让 我 们 记录 一 些 英国 国王 的 五 种 基本 事实 ， 并 注意 ML 的 
回应 : 


val henryV = 
{name = “Henry V", 
born = 1387, 
crowned = 1413, 
died = 1422, 
quote = "Bid them achieve me and then sell my bones"}; 
> val henryV = 
> {born = 1387, 
> died = 1422, 
> name = "Henry V", 
> quote = "Bid them achieve me and then sell my bones", 
> crowned = 1413} 
> : {born: int, 
> died: int, 
> name: string, 
> quote: string, 
> crowned: int} 


ML 把 域 重新 调整 为 一 种 标准 的 上 顺序， 忽略 了 输入 的 顺序 。 记 录 的 类 型 中 列 出 了 每 一 个 域 ， 形 
如 label : pype， 并 用 花 括号 括 起 来 。 下 面 是 另外 两 个 国王 的 记录 : 


val henryVI = 
{name = “Henry VI", 
born = 1421, 
crowned = 1422, 
died = 1471, 
quote = “Weep, wretched man, \ 


\ I’1l aid thee tear for tear"}; 


val richardlll = 
"Richard III", 


{name = 

born = 1452, 

crowned = 1483, 
died = 1485, 
quote = “Plots have I laid...*}; 


henryVi 的 guote 延 伸 到 了 两 行 ， 使 用 了 反 斜 线 -换行 - 反 斜 线 的 转 义 序列 。 

记录 模式 。 由 形 如 label = variable 的 域 构成 的 记录 模式 赋予 每 一 个 变量 相应 的 标签 值 。 如 
时 我 们 不 需要 所 有 的 域 ， 那 么 可 以 在 其 他 域 所 在 的 地 方 写 三 个 点 (.. . )。 下 面 我 们 来 取得 
Henry V 记 录 的 两 个 域 ， 把 它们 叫做 nameV 和 bornV: 
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val {name=nameV, born=bornV, ...} = henryV; 
> val bornV = 1387 : int 
> val nameV = "Henry V" : string 


通常 ， 我 们 想 要 打开 一 个 记录 、 以 便 直 接 看 到 里 面 的 域 。 可 以 用 模式 label = label 来 指定 每 一 
个 域 ,使 变量 和 标签 同名 。 这 种 描述 可 以 简单 地 缩写 为 label。 现 在 打开 记录 Richard II 


val {name, born, died, quote , crowned} = richardlll; 
> val crowned = 1483 : int 


> val born = 1452 : int 

> val died = 1485 : int 

> val quote = "Plots have I laid..." : string 
> val name = "Richard III" : string 


要 想 省 略 一 些 域 ， 就 像 上 面 那样 写 ( . .. )。 现 在 quote 代 表 了 Richard MAR. TRARRE 
合 一 次 一 个 国王 。 

记录 域 的 选择 。 选 择 符 #labe! 可 以 从 记录 里 取得 给 定 的 label 的 值 。 

#quote richardlll; 

> "Plots have I laid..." : string 

#died henryV - #born henryV; 

> 35 : int 
不 同 的 记录 类 型 可 以 包含 同样 的 域 标签 。 座 员 和 国王 都 有 name,"Jones'" 或 是 ”"Henry V". 
上 面 给 出 的 三 个 国王 记录 属于 同一 记录 类 型 ， 因 为 它们 具有 相同 数目 的 域 ， 域 的 标签 和 类 型 
也 都 相同 。 

这 是 另外 一 个 不 同 记 录 类 型 包含 相同 域 标 签 的 例子 : "元 组 (xu x， …, xz 就 是 一 个 使 用 数 
作为 域 标签 的 记录 的 简写 : 

{1 = x1, 2 = X2, s A = Xn} 

没 错 ,， 域 标签 可 以 是 正 整数 ! 有 必要 了 解 这 个 Standard ML 中 的 奇特 事实 ， 其 唯一 的 理由 就 是 : 
使 用 选择 操作 符 # 可 以 提取 n 元 组 里 面 的 第 k 个 分 量 的 值 。 因 此 #1 选择 第 一 个 分 量 ， 而 #2 选择 
第 二 个 分 量 ， 如 果 还 有 第 三 个 分 量 的 话 ， 用 #3 选择 它 ， 依 此 类 推 : 


#2 ("a","b",3, false) ; 
> "b" : string 


A 部 分 记录 描述 。 仅 选择 一 些 域 而 忽略 另 一 些 域 是 不 能 完全 确定 记录 类 型 的 ; 一 
个 函数 只 能 定义 在 完整 的 记录 类 型 之 上 。 比 如 ， 不 能 定义 一 个 函数 让 它 接受 所 有 具 
有 born 和 died 域 的 记录 ， 必 须 指 定 所 有 的 域 标识 〈 通 常 是 利用 类 型 约束 )。 这 种 限制 
使 得 ML 的 记录 很 有 效率 但 不 方便 。 这 种 限制 同样 适用 于 记录 模式 和 域 选 择 操 作 
#label, Ohori (1995) 曾经 在 一 个 ML 的 变种 中 定义 和 实现 了 弹性 记录 。 


声明 记录 类 型 。 让 我 们 声明 国王 的 记录 类 型 。 这 种 缩写 在 函数 的 类 型 约束 中 很 有 用 。 


type king = {name : string, 
born : int, 
crowned : int, 
died : int, 
quote : string); 


> type king 
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我 们 现在 可 以 声明 一 个 关于 类 型 King 的 函数 来 得 到 国王 的 寿命 : 
fun lifetime (k: king) = #died k - #born k; 


> val lifetime = fn : king -> int 
利用 模式 ，lifetime 也 可 以 这 样 声明 : 
fun lifetime ( {born, died, ...}: king) = died - born; 
val lifetime = fn:king -> int 
不 论 哪 种 声明 方式 ， 类 型 约束 都 是 必需 的 。 否 则 ，ML 会 提示 “需要 一 个 固定 的 记录 类 型 ”。 


lifetime henryV; 
> 35 : int 
lifetime richaralll ; 
> 33 : int 


练习 2.8 下 面 的 函数 定义 是 否 需 要 类 型 约束 ? 它 的 类 型 是 什么 ? 


fun lifetime ( {name , born, crowned , died, quote}) = died - born; 


练习 2.9 探讨 一 下 域 选 择 符 #born 和 下 面 的 国 数 有 没有 区 别 ? 有 的 话 区 别 在 哪里 ? 


fun born_at({born}) = born; 


2.10 中 缀 操作 符 


中 级 操作 符 (infix operator) 是 一 个 写 在 它 的 两 个 参数 中 间 的 国 数 。 我 们 使 用 中 缀 运算 符 
是 为 了 和 数学 记 法 看 齐 。 设 想 没 有 中 缀 操作 符 ， 我 们 只 有 将 2+2=4 写 成 =(+(2,2),4) 了 。 大 多 数 
的 函数 式 语 言 都 允许 程序 员 声 明 自 己 的 中 组 操作 符 。 

我 们 这 就 声明 一 个 中 组 操作 符 xor 代 表 “ 异 或 ”运算 。 首 先 使 用 ML 的 infix 指 令 : 

infix xor; 

我 们 现在 必须 写 p xor 9g， 而 不 是 xor(p, q): 


fun (p xor q) = (p orelse q) andalso not (p andalso q); 
> val xor = fn : (bool * bool) -> bool 


xor 国 数 以 一 个 布尔 序 偶 为 参数 ， 并 返回 布尔 结果 。 

true xor false xor true; 

> false : bool 
如 果 有 区 别 的 话 ， 中 组 的 状态 只 是 影响 到 一 个 函数 的 语法 ， 而 不 是 它 的 值 。 通 常 ， 名 字 首 先 
被 指定 成 中 级 ， 然 后 才 定 义 它 的 值 。 

中 级 的 优先 级 。 大 多 数 人 认为 m x n + ij 的 意思 是 (m x n) + (i))， 给 予 乘法 和 除法 高 于 加 
法 的 优先 级 。 类 似 地 ，i - j -的 意思 是 (i - 站- k， 这 是 因为 减法 运算 符 是 左 结 合 的 。 一 条 
ML 的 infix 指 令 可 以 声明 一 个 从 0 到 9 的 优先 级 。 黑 认 的 优先 级 是 0， 也 就 是 最 低级 的 。 指 令 
infix 规 定 操作 符 是 左 结合 的 ， 而 infixz 则 规定 布 结合 。 

为 了 演示 中 组 操作 符 ， 下 面 的 函数 将 几 个 字符 串 放 在 括号 里 面 。 操 作 符 plus 的 优先 级 是 6 
(也 就 是 ML 里 加 号 的 优先 级 ) ， 它 构造 一 个 包含 加 号 的 字符 串 。 

infix 6 plus; 


fun (a plus b) = "(" a "r * bt syns 
> val plus = fn : string * string -> string 





28 #2# 


仔细 观察 ，plus 是 左 结 合 的 : 
"1" plus "2" plus "3"; 
> "((14+2)4+3)" : string 
类 似 地 ，fines 的 优先 级 是 7〈 如 同 ML 里 的 乘法 ) ， 它 构造 了 一 个 包含 乘 号 的 字符 串 。 
infix 7 times; 
fun (a times b) 二 "(e n a A wen ^ b a "yey 
> val times = fn : string * string -> string 
"m" times "n" times "3" plus "i" plus "j" times "k"; 
> "((((m*n) *3)4+i)+(j*k))" : string 
{8 SEHD FE eB Be RE Fi powder, CERRARSE., HLERA. ARAPSRR 
ME. (MLE GRA His AA. ) 
infixr 8 pow; 
fun (a pow b) = "(" ^a^ "#" ~ br YS; 
> val pow = fn : string * string -> string 
"m" times "i" pow "j" pow "2" times "n"; 
> "((m*(i#(j#2)))*n)" : string 
很 多 中 组 操作 符 都 使 用 符号 名 字 。 让 ++ 作 为 向 量 加 法 的 操作 符 : 
infix ++; 
fun ((xl,yl) ++ (x2,y2)) : vec = (xl+x2, yl+y2); 
> val ++ = fn : (real*real) * (real*real) -> vec 


它 和 addvec 的 作用 一 样 ， 只 不 过 使 用 了 中 缀 记 法 : 


b++ (0.1,0.2) ++ (20.0, 30.0); 
> (23.7, 31.1) : vec 


A 而 开 符 号 名 字 。 符 号 名 字 如 果 连 在 一 起 用 会 产生 误会 。 下 面 ，ML 将 +- 读 作 一 个 

符号 名 字 ， 然 后 抱 怒 这 个 名 字 没 定义 : 

1+73; 

> Unknown name +“ 

两 个 符号 名 字 必 须 用 空格 或 其 他 字符 隔 开 : 

1+ “3; 

> 72 : int 

将 中 组 作为 函数 。 有 了 时候， 中 绿 操作 符 必 须 像 一 个 普通 的 函数 一 样 使 用 。 在 ML 里 面 ， 关 
键 字 op 驯 盖 了 中 组 状态 : 如 果 @@ 是 一 个 中 绥 操 作 符 的 话 ， 那 么 op@ 就 是 普通 的 函数 写法 ， 它 
可 以 像 通常 形式 那样 被 应 用 到 一 个 序 偶 上 。 

> op++ ((2.5,0.0), (0.1,2.5)); 

(2.6, 2.5) : real * real 

op” ("Mont", "joy"); 

> "Montjoy" : string 
中 缀 状态 也 可 以 被 取消 。 如 果 @ 是 一 个 中 缀 操作 符 的 话 ， 那 么 指令 nonfix OE ea A A 
数 的 记 法 。 后面 的 jnfix 指 令 又 可 以 将 全 变 成 一 个 中 缀 操作 符 。 

这 里 ,我 们 取消 ML 中 乘法 操作 符 的 中 缀 状态 。 此 时 再 试图 使 用 通常 的 乘法 就 会 产生 错误 ， 
因为 我 们 不 能 将 3 用 作 函 数 。 然 而 ， 现 在 * 可 以 被 应 用 作 普 通 的 冰 数 了 : 
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nonfix *; 

3*2; 

> Error: Type conflict... 

*(3,2); 

> 6 : int 
nonfix 指 令 是 为 了 交互 式 的 语法 开发 而 设计 的 ， 可 以 试验 操作 符 不 同 的 优先 级 和 结合 方式 。 
随便 改变 已 有 操作 符 的 中 组 状态 将 导致 混乱 。 


表达 式 的 求 值 


命令 式 的 程序 指定 命令 来 更 新 机 器 的 状态 。 运 行 期 间 ， 状 态 每 秒 改 变 几 百 万 次 。 它 的 结 
构 也 发 生变 化 : 局 部 变量 不 断 地 被 创建 和 销毁 。 即 使 程序 有 一 个 与 硬件 细节 无 关 的 数学 含义 ， 
这 个 含义 也 超出 了 程序 员 的 理解 力 。 公 理 语义 和 指称 语义 的 定义 只 对 少数 专家 有 意义 。 程 序 
员 只 是 依赖 调试 工具 和 他 们 的 直觉 来 修改 程序 。 

函数 式 程序 设计 的 目的 是 想 给 每 个 程序 一 个 直接 的 数学 含义 。 它 简化 了 程序 在 我 们 脑海 
里 执行 的 样子 ， 因 为 没有 状态 的 改变 。 执 行 只 是 将 一 个 表达 式 简 化 成 它 的 值 ， 将 相等 的 东西 
进行 灰 换 。 对 大 多 数 纹 数 定义 的 理解 仅 涉 及 初等 数学 。 

当 应 用 一 个 函数 的 时 候 ， 比 如 态 E)， 必 须 把 参数 天 提供 给 的 国 数 体 。 如 果 一 个 表达 式 涉 及 
了 多 个 函数 调用 ， 那 么 必须 根据 一 些 求 值 规则 来 选择 其 中 一 个 。ML 采 用 的 求 值 规则 是 传 值 调 
用 (call-by-value) 或 称 为 严格 (strict) 求 值 ， 而 多 数 纯 函 数 式 语言 则 采用 传 需 调 用 (call- 
by-need) MPRA MH (lazy) 求 值 。 

每 种 求 值 规则 都 有 自己 的 派别 。 为 了 进行 比较 ， 我 们 来 看 两 个 简单 的 函数 。 平 方 函数 *9r 
将 参数 使 用 了 两 次 : 

fun sqr(x) : int = x*x; 

> val sqr = fn : int -> int 
16 PR zero 了 它 的 参数 而 直接 返回 0: 


fun zero(x : int) = 0; 
> val zero = fn : int -> int 


4-7 pa BR AAR, ea Bic fs HFK SB EK PS ER. RAB RUM ETT AI eK 
际 参 数 求 值 、 进 行 儿 遍 求 值 这 些 方 面 上 是 有 所 区 别 的 。 形 式 参数 指示 了 在 函数 体 的 什么 地 方 
进行 替换 。 此 外 ， 形 式 参数 的 名 字 并 没有 其 他 的 意义 ， 在 函数 定义 之 外 也 没有 任何 意义 。 


2.11 ML 中 的 求 值 : 传 值 调 用 


假设 表达 式 是 由 常量 、 变 量 、 函 数 调用 和 条 件 表达 式 (if-then-else) 构成 的 。 常 量 
具有 显 式 的 值 ; 变量 在 环境 中 有 绑 定 到 它 的 值 ; 所 以 求 值 只 是 处 理 函 数 调 用 和 条 件 表达 式 。 
ML 的 求 值 规则 是 基于 一 个 简单 的 想法 。 

为 了 求 得 用 E) 的 值 ， 首 先 对 表达 式 E 进 行 求 值 。 

这 个 值 赫 换 了 /函数 体内 的 形式 参数 ， 然 后 函数 就 可 以 进一步 求 值 了 。 模 式 匹配 增加 了 一 点 点 
复杂 性 ， 如 果 f 声 明 为 : 

fun f (x,y,z) = body 
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那么 就 用 下 值 的 相应 部 分 去 替换 模式 变量 zx、7 和 z。!( 一 种 现实 的 实现 方法 就 是 不 作 任 何 替 换 , 
而 是 将 形式 参数 绑 定 到 函数 的 局 部 环境 中 。) 
看 一 下 ML 是 怎样 计算 sgr(sqr(sqr(2))) 的 。 在 三 个 函数 调用 中 ， 只 有 最 里 面 的 那个 参数 有 
值 。 因 此 sqr(sgqr(sqr(2))) 可 以 简化 为 sgr(sqr(2 x 2))。 现 在 必须 对 乘法 求 值 ， 得 到 了 sqr(sqr(4))。 
对 内 层 调用 求 值得 到 了 sqr(4 x 4)， 依 此 类 推 。 简 化 可 以 写作 sqr(sqr(4)) = sgr(4 x 4)。 完 整 的 
[39] 计算 是 这 样 的 : | 


sqr(sqr(sqr(2))) => sqr(sqr(2 x 2)) 


=> sqr(sqr(4)) 
=> sgr(4 x 4) 
=> sqr(16) 
= 16x 16 
=> 256 
现在 再 看 一 下 zero(sqr(sgr(sqr(2))))。zero 的 参数 是 上 面 表达 式 的 求 值 结果 。 求 值 是 进行 了 ,但 
是 值 又 被 忽略 掉 了 : 
zero(sgr(sgr(sqgr(2)))) => zero(sgr(sgr(2 x DD 
=> zero(256) 
=> 0 
多 浪费 啊 ! zer IARR SL, HEABSA ERR CRA RDT AT 
有 的 参数 。 


ML 的 求 值 之 所 以 被 称 为 传 值 调用 ， 是 因为 总 是 将 函数 参数 的 值 传 进 函数 。 不 难看 出 ， 这 
是 我 们 通常 用 纸 笔 进行 手 算 所 采取 的 步骤。 几乎 所 有 的 程序 设计 语言 都 采用 它 。 不 过 我 们 也 
需要 看 看 那 种 只 用 一 步 就 将 zero(sqr(sqr(sgr(2)))) 简 化 到 0 的 求 值 方法 。 在 讨论 这 个 问题 之 前 ， 
必须 要 先 看 看 递归 。 


2.12 传 值 调用 下 的 递归 函数 
阶乘 函数 是 递归 的 标准 例子 。 它 包括 一 个 基本 情形 : n= 0， 此 时 求 值 过 程 停止 。 


fun fact n = 
if n=0 then 1 else n * fact(n-1); 
> val fact = fn : int -> int 
fact 7; 
> 5040 : int 
fact 35; 
> 10333147966386144929666651337523200000000 : int 


ML 像 下 面 那样 对 名 cx(4) 求 值 。 实 际 参 数 4 取代 了 国 数 体内 的 上 ， 得 到 
if 4=0 then 1 else 4x fact(4— 1) 
由 于 4 = 0 不 成 立 ， 条 件 表 达 式 简化 为 4 x jacr(4 - 1)。 然 后 对 4-1 求 值 ， 整 个 表达 式 简化 为 4 x 
fact(3)。 图 2-1 总 结 了 求 值 过 程 。 条 件 表达 式 没 出 现在 内 ， 它 们 除了 n = 0 时 都 差不多 ,，n = 0 时 





训 字 、 场 数 和 类 型 31 


条 件 表达 式 的 值 是 1。 


fact(4) => 4 x fact(4 — 1) 
=> 4 x fact(3) 
=> 4 x (3 x fact(3 — 1)) 
= 4 x (3 x fact(2)) 
=> 4 x (3 x (2 x fact(2 — 1))) 
= 4 x (3 x (2 x fact(1))) 


= 4 x (3 x (2 x (1 x fact(1 — 1)))) 
= 4 x (3 x (2 x (1 x fact(0)))) 

=> 4 x (3 x (2 x (1 x 1))) 

=> 4x (3x (2x 1) 

= 4x (3 x 2) 

>4x6 

=> 24 





图 2-1 fact(4) PARA 


Jact(4) 的 计算 完全 是 按照 阶乘 的 数学 定义 进行 的 : 0! = 1， 而 当 n > OR, n!=nx(n- 1)!。 
过 程式 语言 中 的 递归 过 程 的 执行 能 这 么 简洁 地 表达 吗 ? 

选 代 函 数 。joacr(4) 的 求 值 有 点 奇怪 。 当 递归 展开 的 时 候 ， 越 来 越 多 的 数 等 待 着 被 乘 。 乘 法 
迟 迟 不 能 进行 ， 直 到 /acr0)， 这 时 则 要 计算 4x (3 x (2 x (1 x 1)))。 这 个 笔算 过 程 显示 fact 浪 费 
了 空间 。 

通过 思考 应 该 怎样 来 计算 阶乘 ， 可 以 得 到 一 个 更 有 效 的 函数 版 本 。 根 据 乘法 结合 律 ， 每 
个 乘法 都 是 可 以 立即 进行 的 : 

4 x (3 x fact(2)) = (4 x 3) x fact(2) = 12 x fact(2) 

计算 机 是 不 会 自动 应 用 这 个 定律 的 ， 除 非 我 们 要 它 这 么 做 。 函 数 facti 在 p 里 面 保留 了 一 个 不 断 
变化 的 积 ， 它 的 初 值 是 1: | 

fun facti (n,p) = 

if n=0 then p else facti(n-1, n*p); 

> val facti = fn : int * int -> int 
比较 图 2-2 所 示 的 facti(4, 1) 的 求 值 过 程 和 fact(4) 的 求 值 过 程 ， 前 者 一 直 保持 着 较 小 的 中 间 表 达 
式 ， 每 个 乘法 都 可 以 立即 进行 ， 并 且 所 需要 的 存储 空间 的 大 小 是 固定 的 。 这 个 求 值 过 程 是 迭 
代 的 (iterative ) ， 也 叫做 尾 递 归 的 (tail recursive)。 在 6.3 节 中 ， 我 们 会 通过 建立 定理 facti(n， 
p) =n! x p 来 证 明 facti 给 出 的 结果 是 对 的 。 

好 的 编译 器 可 以 检测 出 迭代 形式 的 递归 并 高 效 执行 。 递 归 调 用 facti(n - 1, ax 万 的 结果 不 
需 进一步 计算 而 直接 作为 facti(n, 六 的 结果 。 这 样 的 尾 调 用 (tail call) 可 以 优化 执行 : 将 新 值 
赋予 参数 4x 和 p， 然 后 直接 跳 回 函数 开始 ， 避 免 了 正式 函数 调用 的 开销 。 在 函数 fact 中 的 递归 调 
用 不 是 尾 调用 ， 因 为 它 返 回 的 值 要 进行 进一步 地 运算 ， 也 就 是 还 要 乘 以 m。 

很 多 函数 都 可 以 通过 增加 一 个 参数 来 变 成 迭代 的 ， 就 像 户 c# 中 的 p。 有 时 选 代 函 数 运行 起 
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数 都 增加 一 个 参数 是 个 坏 习惯 ， 它 导致 了 难看 的 、 费 解 的 代码 ， 其 至 可 能 运行 得 更 慢 。 


facti(4, 1) => facti(4 — 1,4 x 1) 
=> facti(3, 4) 
=> facti(3 — 1,3 x 4) 
=> facti(2, 12) 


=> facti(2 — 1,2 x 12) 
=> facti(1, 24) 

> facti(l ~ 1,1 x 24) 
=> facti(0, 24) 

=> 24 





图 2-2 facti(4, 1) 的 求 值 . 
条 件 表达 式 的 特殊 作用 。 条 件 表 达 式 允许 进行 分 情 定义 。 回 想 一 下 阶乘 函数 是 怎样 定义 


的 : 

0!=1 

ni=nx(n-l)! 当 n > 0 时 
这 些 等 式 确定 了 所 有 n> 0 的 整数 的 n!。 忽 略 了 第 二 个 等 式 的 条 件 n > OR SBA IE: 


1=0!=0x(-1)!=0 

类 似 地 ， 在 条 件 表达 式 

if E then E, else E 
中 ，ML 仅 当 E 为 真 的 时 候 才 会 计算 El， 而 仅 当 E 为 假 的 时 候 才 会 计算 E。 

由 于 是 传 值 调用 ， 所 以 不 可 能 存在 一 个 ML 的 函数 cond 可 以 像 条 件 表达 式 那 样 计算 cond(E， 
Ei, Ey)。 我 们 可 以 尝试 声明 一 个 ， 并 用 它 来 编写 阶乘 尔 数 : 

fun cond(p,x,y) : int = if p then x else y; 

> val cond = fn : bool * int * int -> int 


fun badf n = cond(n=0, 1, n*badf(n-1)); 
> val badf = fn : int -> int 


这 可 能 看 上 去 不 错 ， 不 过 每 一 个 badf 的 调用 都 不 会 停 下 来 。 观 察 一 下 padKo) 的 计算 过 程 : 
badf (0) = cond(true, 1,0 x badf(—1)) 
=> cond(true, 1,0 x cond(false, 1, —1 x badf(—2))) 


虽然 cond 永 远 不 会 需要 所 有 的 三 个 参数 ， 但 是 传 值 调用 规则 却 要 对 它们 全 部 求 值 。 这 样 一 来 ， 
递归 就 不 会 结束 。 
条 件 的 与 和 或 。ML 的 中 缀 布尔 操作 符 andalso 和 orelse 并 不 是 函数 ， 只 代表 某 类 条 件 
表达 式 E, andalso Es 是 下 式 的 简写 
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if E, then E, else false : 
4i 
KIKKE, orelse 已 是 下 式 的 简写 ? 
if E, then true else E 
这 两 个 操作 符 完 成 了 布尔 运算 与 和 或 ， 但 是 它们 仅 当 需要 时 才 会 对 已 求 值 。 如 果 它 们 是 函数 
的 话 ， 传 值 调用 规则 会 对 两 个 参数 都 求 值 。 其 他 ML 中 绥 操 作 符 虽 的确 是 函数 。 
andalso 和 orelse 的 顺序 求 值 方式 使 得 它们 很 适合 于 表达 递归 谓词 (返回 布尔 值 的 国 
数 )。 国 数 powofrwo 测 试 一 个 数 是 不 是 二 的 整数 次 医 : 


fun even n = (n mod 2 = Q); 
> val even = fn : int -> bool 
fun powoftwo n = (n=1) orelse 


(even(n) andalso powoftwo(n div 2)); 
> val powoftwo = fn : int -> bool 


你 可 能 已 经 预料 到 powopwo 是 由 条 件 表 达 式 定义 的 ， 没 错 ， 是 通过 orelse 和 andalso 来 定 
义 的 。 求 值 在 结果 一 出 来 时 就 立刻 停止 了 : 
powoftwo(6) > (6 = 1) orelse (even(6) andalso ---) 

= even(6) andalso powoftwo(6 div 2) 

= powoftwo(3) 

=> (3=1) orelse (even(3) andalso ---) 

= even(3) andalso powoftwo(3 div2) 

=> false 


练习 2.10 Bipowoftwo(8) Hite. 
练习 2.11 powofiwo 是 不 是 一 个 迭代 水 数 ? 
2.13 传 需 调 用 或 情 性 求 值 


传 值 调 用 规则 积聚 了 许多 的 不 满意 见 。 它 多 余地 计算 了 zero(E) 中 的 下 ， 也 多 余地 计算 了 
cond(E, Ei, E;) 中 的 El 或 E1,。 条 件 表 达 式 和 类 似 的 操作 不 能 作为 函数 。 虽 然 ML 提 供 了 关键 字 
andalsofflorelse, 但 是 我 们 没 办 法 定义 类 似 的 东西 。 

能 否 把 参数 作为 表达 式 而 不 是 值 传 进 函 数 呢 ? 总 的 思路 是 这 样 的 : 

为 了 计算 凡 E) 的 值 ， 直 接 将 巨 替 换 进 的 邓 数 体 。 

然后 ， 计 算 所 得 到 的 表达 式 的 值 。 
这 就 是 传 名 调用 (call-by-name) 规则 。 它 将 zero(sqr(sqr(sqr(2)))) 立 即 简 化 到 0。 但 是 对 于 
sqr(sdr(sqgr(2))) 却 很 精 糕 ， 它 重复 使 用 了 参数 sgr(sqgr(2))。 这 个 “简化 ”的 结果 是 

sqr(sqr(2)) x sqr(sqr(2)) 
之 所 以 这 样 ， 是 因为 sgr(x) =x x. 

乘法 和 其 他 算术 运算 一 样 需 要 特别 处 理 。 它 必须 应 用 到 值 上 ， 而 不 是 应 用 在 表达 式 上 : 
它 是 严格 (strict) 函数 的 一 个 例子 。 为 了 计算 E; x E,， 必 须 首先 计算 E, 和 E,。 

让 我 们 继续 上 面 的 平方 求 值 。 由 于 最 外 面 的 函数 是 x ， 是 个 严格 函数 (参数 不 是 值 则 不 
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能 直接 计算 ) ， 规 则 选择 了 先进 行 最 左边 的 ser 调 用 。 它 的 参数 同样 是 重复 的 : 
(sqr(2)  sqr(2)) x sqr(sqr(2)) 
完整 的 计算 就 像 下 面 这 样 : 
sqr(sqr(sqr(2))) = sqr(sqr(2)) x sqr(sqr(2)) 
=> (sqr(2) x sqr(2)) x sqr(sqr(2)) 
=> ((2 x 2) x sgr(2)) x sqr(sqr(2)) 
=> (4 x sgr(2)) x sgr(sqr(2)) 
=> (4 x (2 x 2)) x sgr(sqr(2)) 


会 得 到 结果 吗 ? 最 后 是 会 的 。 但 是 传 名 调用 不 会 是 我 们 所 期 望 的 求 值 规则 。 

EAA (call-by-need) 规则 (EERE) 类 似 传 名 调用 ， 不 过 保证 了 对 每 一 个 参数 最 
多 求 一 次 值 。 它 不 直接 将 一 个 表达 式 替 换 进 函数 体 ， 而 是 在 参数 出 现 的 地 方 用 指针 连接 到 表 
达 式 上 。 如 果 参 数 指向 的 表达 式 曾 被 求 值 ， 那 么 这 个 参数 出 现 的 地 方 都 共享 这 个 值 。 指 针 结 
构 构 成 了 关于 函数 和 参数 的 有 向 图 。 当 图 的 一 部 分 被 求 过 值 后 ， 图 会 被 结果 值 所 更 新 。 这 称 
为 图 归 约 (graph reduction), 

图 2-3 示 意 了 一 个 图 归 约 过 程 。 每 一 步 都 将 一 个 sgr(E) 赫 换 成 ExE， 这 里 两 个 E 是 共享 的 。 
没有 多 余 的 重复 : 总 共 只 有 三 个 乘法 计算 。 我 们 似乎 得 到 了 两 个 世界 里 最 好 和 的， 对 于 zero(E) 
来 说 也 可 以 立即 简化 到 0。 但 是 对 图 的 维护 所 需 的 代价 是 很 高 的 。 

cond(E, Ey, Ey) 中 的 惰性 求 值 效 果 和 条 件 表达 式 一 样 ， 但 先决 条件 是 元 组 (E, E, 已) 本 身 也 是 情 
性 求 值 的 。 这 方面 的 细节 是 很 巧妙 的 : 元 组 形式 必须 被 看 成 是 一 个 函数 。 对 于 像 (E, E, E) 这 样 的 
数据 结构 进行 部 分 求 值 的 思想 一 一 也 就 是 只 对 E, 和 Es 其 中 之 一 求 值 ， 可 以 引出 无 穷 表 的 概念 。 

严格 求 值 和 惰性 求 值 的 比较 。 传 需 调 用 做 到 了 最 少 的 求 值 。 它 似乎 是 获得 高 效 的 途径 。 
但 是 它 所 需 的 维护 开销 也 很 大 。 它 的 实现 仅 在 David Turner (1979) 将 图 归 约 应 用 到 组 合子 
(combinator) 之 后 才 真 正 变 得 可 行 。 他 使 用 了 和 -演算 的 某 些 蜀 涩 的 特性 来 开发 新 的 编译 技术 ， 
研究 员 们 仍 在 不 断 地 进行 完善 。 每 种 新 的 技术 都 有 它 的 卫 道士 : 有 些 人 说 惰性 求 值 才 是 真正 
的 方向 、 真 理 和 曙光 。 那 为 什么 Standard ML 不 采用 它 呢 ? 

即使 有 的 计算 不 能 终止 ， 惰 性 求 值 也 会 告诉 我 们 zero(E) = 0。 这 可 是 在 数学 传统 面前 要 刀 
T: 一 个 表达 式 是 有 意义 的 ， 当 且 仅 当 它 的 每 个 部 分 都 是 有 意义 的 。Alonzo Church， 入 -演算 
的 发 明 者 ， 更 喜欢 它 的 一 个 变 体 ( 和 -演算 )， 这 个 变 体 是 禁止 像 zero 这 样 的 常 函 数 的 。 

无 穷 数 据 结构 使 得 数学 论证 复杂 化 了 。 要 完全 理解 惰性 求 值 除了 需要 知道 入 -演算 之 外 ， 
还 要 慌 一 些 论 域 理论 。 程 序 的 输出 不 再 是 简单 的 一 个 值 了 ， 而 是 一 个 部 分 求 值 的 表达 式 。 这 
些 概 念 学 起 来 都 不 简单 ， 而 且 很 多 都 只 不 过 是 手段 而 已 。 如 果 只 能 借助 求 值 的 手段 来 思考 的 
话 ， 我 们 比 过 程式 的 程序 员 也 好 不 了 多 少 。 

效率 方面 也 存在 很 多 问题 。 有 时 惰性 求 值 节省 了 相当 多 的 空间 ; 有 时 它 也 会 浪费 空间 。 
回想 一 下 ,facti 在 严格 求 值 下 比 fact! 要 更 有 效率 ， 每 个 乘法 都 是 立即 进行 的 。 而 facti(n, pR 
性 求 值 会 立即 对 n 求 值 ( 这 是 为 了 测试 n = 0)， 但 对 p 则 不 然 。 这 样 ， 乘 法 就 积累 起 来 了 ， 我 们 
也 就 浪费 了 空间 〈 见 图 2-4)。 
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图 2-3 sqr(sgr(sqr(2)) IAAL) 


facti(4, 1) = facti(4— 1,4 x 1) 
> facti(3 — 1,3 x (4x I) 
. = facti(2 — 1,2 x (3 x (4 x 1))) 
=> factil — 1, 1 x (2 x (3 x (4 x 1))) 
=> 1 x (2x (3x (4x 1))) 


=> 24 
图 2-4 情 性 求 值 的 空间 漏洞 
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大 多 数 惰性 求 值 的 程序 设计 语言 都 是 纯 函数 式 的 。 在 ML 中 是 通过 命令 来 进行 输入 输出 的 ， 
情 性 求 值 能 和 命令 组 合 在 一 起 蚂 ? 它 可 能 会 在 不 可 预知 的 时 候 对 子 表达 式 进 行 求 值 ， 在 这 种 
情况 下 几乎 不 可 能 写 出 可 靠 的 程序 。 很 多 研究 都 指出 应 该 将 函数 式 程 序 设 计 和 命令 式 程 序 设 
计 结 合 在 一 起 (Peyton Jones 和 Wadler，1993 ) 。 


书写 递归 函数 


由 于 递归 在 函数 式 程序 设计 中 是 很 基本 的 ， 因 此 让 我 们 花 些 时 间 来 剖析 几 个 递归 函数 。 
程序 设计 并 没有 魔术 般 的 公式 可 循 ， 不 过 也 许可 以 通过 例子 来 学 习 。 我 们 已 经 看 过 的 这 个 递 
归 函 数 实现 了 欧 几 里 得 算法 ( 思 转 相 除 法 ): 

fun gcd(m,n) = 

if m=0 then n 
else gcd(n mod m, m); 

> val gcd = fn : int * int -> int 
两 个 整数 的 最 大 公 因 子 的 定义 是 可 以 整除 这 两 个 数 的 最 大 整数 。 欧 几 里 得 算法 是 正确 的 ， 因 
为 整除 m 和 nn 的 数 和 整除 m 和 n-m 的 一 样 ， 并 且 经 过 重复 地 相 减 ， 就 和 能 整除 m 和 n mod m 的 一 
样 了 。 我 们 可 以 看 看 算法 的 效率 

gcd(5499,6812) = gcd(1313, 5499) = gcd(247, 1313) 
=> gcd(78, 247) => gcd(13, 78) = gcd(0, 13) > 13 
欧 几 里 得 算法 要 追溯 到 古代 了 。 我 们 未 必 能 赶 上 积淀 了 两 千年 的 智慧 ， 不 过 我 们 应 该 朝 着 同 
样 典 雅 和 高 效 的 解法 而 努力 。 

递归 涉及 到 将 问题 简化 为 更 小 的 子 问题 。 效 率 的 关键 是 选择 适当 的 子 问题 。 这 样 的 子 问 

题 一 定 不 会 很 多 ， 而 剩 下 的 计算 应 该 就 是 很 简单 的 了 。 


2.14 Sark 


显然 的 计算 区 的 方法 是 反复 地 乘 以 xz。 使 用 递归 ， 问 题 六 可 以 被 简化 成 子 问题 六 。 但 是 zx 
不 用 计算 10 次 乘法 ， 我 们 可 以 先 计算 x*， 然 后 将 其 平方 。 由 于 x ”= xx 关 ， 我 们 同样 可 以 通过 
平方 计算 x*: 
x = (PF = a x tY = (x x 0) 
通过 使 用 定律 x*” = (xm):， 我 们 已 经 比重 复 的 乘法 进步 很 多 了 ， 然 而 计算 过 程 仍旧 比较 混乱 ， 
使 用 x” = C》 省 去 了 媒 套 的 平方 : 
20=4=4x16:=4x256!= 1024 
通过 这 个 方法 ，power 对 于 实数 x 和 大 于 0 的 整数 kx 进 行 了 x* 的 计算 : 
fun power(x,k) : real = 
if k=1 then x 
else if k mod 2 = 0 then power (x*x, k div 2) 


else x * power(x*x, k div 2); 
> val power = fn : real * int -> real 


注意 mod 是 怎样 判断 指数 的 奇偶 的 。 整 数 除法 (div) 中 ， 当 k 是 奇数 时 ， 截 取 商 的 整数 部 分 。 
函数 power 体 现 了 下 面 的 等 式 ( 当 n> 0 时 ): 
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x'=x 
x” = (x)" 
enti =x Ce 


我 们 可 以 用 内 置 的 指数 函数 Math.pow 来 核对 一 下 power 的 结果 : 

power(2.0,10); 

> 1024.0 : real | 

power(1.01, 925); 

> 9937.353723 : real 

Math.pow(1.01, 925.0); 

> 9937.353723 : real 
RERO TS A ("EB power HIS — TB AVA FA RE. STA ( 当 指 数 为 
奇数 时 ) 只 能 通过 添加 一 个 存储 结果 的 参数 来 变 成 选 代 的 ， 这 会 增加 不 必要 的 复杂 性 。 
练习 2.12 写 出 power(2.0, 29) 的 计算 步骤 。 
练习 2.13 在 最 坏 的 情况 下 ，power(x, 所 要 进行 多 少 次 乘法 ? 


练习 2.14 为 什么 不 选择 上 = 0 作为 递归 的 基本 情形 ， 而 用 上 = 1 呢 ? 
2.15 辈 波 那 契 数列 


斐 波 那 契 数列 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, .…， 由 于 拥有 众多 奇妙 的 性 质 ， 对 于 数学 爱 
好 者 来 说 是 非常 熟悉 的 。 数 列 (Fi) 定 义 如 下 
Fo=0 
F,=1 
FP, = Fao + Fl 当 n > 2 时 
相应 的 递归 函数 是 一 个 评测 编译 器 生成 代码 效率 的 基准 。 对 于 其 他 的 用 途 来 说 ， 用 它 就 太 慢 
了 ， 因 为 这 个 方法 不 断 地 重复 计算 同样 的 子 问题 。 例 如 ， 由 于 
F; = Fe + Fr = Fe + (Fs + Fe) 
CEFA TAH. 
每 一 个 斐 波 那 契 数 都 是 前 面 两 个 的 和 : 
0+1=1 1+1=2 1+2=3 2+3=5 3+S=8… 
所 以 我 们 应 该 用 序 偶 来 计算 。 函 数 nextfib 以 (Pt 书 ) 为 参数 ， 返 回 下 一 个 序 偶 (Fu, Frei) 
fun nextfib (prev, curr :int) = (curr, prev+curr) ; 
> val nextfib = fn : int * int -> int * int 
特殊 名 字 并 代表 了 上 一 个 序 偶 ， 可 以 帮助 我 们 来 演示 这 个 函数 : 


nextfib (0,1); 

> (1, 1) : int * int 
nextfib it; 

> (1, 2) : int * int 
nextfib it; 

> (2, 3) : int * int 
nextfib it; 


> (3, 5) : int * int 
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通过 递归 将 nextfib 应 用 必要 的 次 数 : 

fun fibpair (n) = 

if n=1 then (0,1) else nextfib(fibpair(n-1)); 

> val fibpair = fn : int -> int * int 
它 可 以 非常 迅速 地 计算 出 (F296, Fao)， 如 果 照 原先 的 办 法 可 能 需要 接近 三 百 万 次 的 函数 调用 : 

fibpair 30; 

> (514229, 832040) : int * int 
我 们 来 仔细 地 看 看 为 什么 fibpair 是 正确 的 。 很 显然 fibpair(1) = (Fo, Fi). MR 4n> 1 时 下 式 
成 立 

fibpair(n) = (Fn-1, Fn) 
那么 则 有 
fibpair(n+)) = (Fn, Fn + Fn) = (Fn, Fret) 

刚才 看 到 了 一 个 关于 fibpair(n) = (Fa, Fo) 的 证 明 , 使 用 了 数学 归纳 法 (mathematical induction). 
我 们 将 在 第 6 章 看 到 更 多 这 样 的 证 明 。 证 明 函 数 式 程序 的 性 质 往往 是 很 直接 的 ， 这 也 是 函数 式 
语言 的 一 个 主要 优点 。 

函数 fbpair 使 用 了 一 个 正确 且 相 当 有 效 的 算法 来 计算 斐 波 那 契 数 ， 并 展示 出 如 何 使 用 序 
偶 来 进行 计算 。 但 是 它 的 递归 模式 浪费 了 空间 : fibpairtaia REAR 

nextfib(nextfib(---nextfib(O, 1)---)) 

为 了 使 算法 成 为 迭代 的 ， 让 我 们 把 计算 过 程 反 过 来 ， 由 里 到 外 地 进行 : 

fun itfib (n, prev, curr) : int = 

if n = 1 then curr (* 对 fn = Of Tig *) 


else itfib (n-1, curr, prev+curr); 
> val itfib = fn : int * int * int -> int 
函数 fib 则 使 用 正确 的 初 值 来 调用 itfib: 
fun fib (n) = itfib(n,0,1); 
> val fib = fn : int -> int 
fib 30; 
> 832040 : int 


fib 100; 
> 354224848179261915075 : int 


对 于 斐 波 那 契 数 来 说 ， 和 迭代 要 比 递 归 更 清楚 些 : 

itfib(7 0,1) = itfib(6,1,1) = +- itfib( 8,13) = 13 
在 6.3 节 中 ， 我 们 将 通过 证 明 一 个 不 太 寻 常 的 定律 itfib(n, Fe Fest) = Fe 来 证 明 itjib 是 正确 的 。 
练习 2.15 ”F, 的 递归 定义 中 的 重复 计算 和 传 名 调用 规则 有 怎样 的 关系 ? 惰性 求 值 能 有 效 地 执 
行 这 个 定义 吗 ? 
练习 2.16 证 明 用 递归 定义 来 运算 F, 所 需 的 步骤 数 是 以 n 为 指数 的 。fib 的 运算 次 数 呢 ? 假 设 使 
用 传 值 调 用 。 
练习 2.17 itfib(n, Fin, FD 的 值 是 什么 ? 
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2.16 整数 平方 根 


整数 4 的 平方 根 整数 是 k， 满 足 
ken<(k+1) 
为 了 递归 地 计算 它 ， 必 须 选择 一 个 子 问题 :一 个 比 x 小 的 整数 。 除 以 2 通常 是 不 错 的 选择 ， 但 
是 我 们 怎么 能 从 Vx 得 到 V2x 呢 ”考虑 到 V4x =2Vx (对 于 实数 x)， 除 以 4 可 能 会 是 一 个 简单 
的 算法 。 
假设 x > 0。 由 于 n 不 一 定 能 被 4 整除 ， 所 以 我 们 就 写 n = 4m + r， 这 里 r = 0, 1, 2 或 3。 因 为 
m < n， 所 以 ， 我 们 可 以 递归 地 找到 m 的 整数 平方 根 : 
Pam<(i+ iy 
因为 m 和 i 都 是 整数 ， 所 以 m + 1< (i+ 1)。 乘 以 4 我 们 有 4 < 4m 和 4(m + 1) < 4(i+ 1》。 因 此 : 
(2 <4m<n<4m4+4< (214+ 2) 
n 的 整数 平方 根 就 是 2i 或 者 2i+ 1， 只 需要 对 (2i + 1? < n 作 出 判定 就 可 决定 是 否 需要 加 1。 


fun increase (k,n) 
> val increase 


递归 在 n = 0 时 结束 。 不 断 地 进行 整数 除法 会 将 任何 一 个 整数 最 终 变 到 0: 
fun introot n = 


if n=0 then 0 else increase(2 * introot(n div 4), n); 
> val introot = fn : int -> int 


虽然 还 有 更 快 的 计算 平方 根 的 方法 ， 但 是 我 们 的 算法 已 经 很 快 了 ， 并 且 是 一 个 简单 的 递归 
演示 。 

introot 123456789; 

> 11111 : int 

it* it; 

> 123454321 : int 

introot 2000000000000000000000000000000; 

> 1414213562373095 : int 

it* it; 

> 1999999999999999861967979879025 : int 


练习 2.18 将 这 个 整数 平方 根 算法 用 过 程式 程序 设计 语言 的 迭代 来 编写 代码 。 
练习 2.19 基于 下 面 的 等 式 (m 和 n 都 是 正 整数 )，、 声 明 一 个 ML 函数 来 计算 最 大 公 因 子 : 


GCD(2m,2n) = 2 x GCD(m, n) 
GCD(Qm, 2n +1) = GCD(m, 2n +1) 
GCD(2m +1,2n+1) = GCD(n-m,2m +1) 
GCDim,m)=m 


这 个 算法 和 欧 几 里 得 算法 比较 起 来 怎么 样 ? 
局 部 声明 
约 分 分 数 ma 到 最 简 式 ， 也 就 是 说 使 得 和 4 没有 公约 数 ， 这 要 将 两 个 数 除 以 它们 的 最 大 公 


if (k+1)* (k+1) > n then k else k+1; 
fn : int * int -> int 


m<n 
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因子 。 
fun fraction (n,d) = (n div gcd(n,d), d div gcd(n,d)); 
对 gcd(n, 四 的 重复 计算 是 浪费 的 ， 可 以 通过 预先 定义 一 个 辅助 函数 来 避免 : 
fun divideboth (n, d, com: int) = (n div com, d div com); 
fun fraction (n,d) = divideboth (n, d, gcd(n,d)); 
但 是 通过 这 种 办 法 来 将 gcd(n, 中 ) 命 名 为 com 有 点 绕 变 了 。ML 允 许 在 一 个 表达 式 里 面 声明 几 个 名 字 : 


fun fraction (n,d) = 
let val com = gcd(n,d) 
in (n div com, d div com) end; 
> val fraction = fn : int * int -> int * int 


上 面 使 用 了 let 表 达 式 ， 它 的 一 般 形 式 是 

let D in E end 
在 求 值 过 程 中 ， 首 先 对 声明 D 进 行 求 值 ， 对 声明 中 的 表达 式 进 行 求 值 ， 并 且 将 其 结果 命名 。 这 
样 建立 起 来 的 环境 仅 在 let 表 达 式 中 是 可 见 的 。 然 后 再 对 表达 式 E 进 行 求 值 ， 它 的 值 作为 整个 
表达 式 的 值 返回 。 

通常 D 是 复合 声明 ， 也 就 是 说 包含 一 系列 的 声明 : 

Dj; Dy; -3 D, 

每 个 声明 的 作用 在 后 续 的 声明 中 都 是 可 见 的 。 这 里 分 号 是 可 选 的 ， 很 多 程序 员 都 会 省 略 它们 。 


2.17 WF: 实数 平方 根 


牛顿 -拉夫 森 方法 可 以 找到 函数 的 根 : 换 甸 话说 ， 它 可 以 求解 形 如 f(x) = 0 的 方程 。 在 已 知 
一 个 好 的 初始 近似 值 的 情况 下 ， 它 会 收敛 得 很 快 。 这 个 方法 对 于 计算 平方 根 非常 有 效 ， 只 要 
解 方程 a - x = 0 就 可 以 了 。 要 计算 Ya ， 就 要 选择 任意 一 个 正 数 各 ， 比 如 1， 作 为 第 一 个 近似 
值 。 如 果 x 是 当前 的 近似 值 ， 那 么 下 一 个 近似 值 就 是 (a/x+x)/2。 当 相 邻 近似 值 的 差 足 够 小 的 时 
候 就 可 以 停止 计算 了 。 

函数 findroot 实 现 了 这 个 算法 ，x 是 a 的 平方 根 的 近似 值 ， 而 acc 是 相对 于 x 的 精度 。 由 于 相 
邻 的 近似 值 要 用 到 几 次 ， 我 们 使 用 Let 来 给 nextx 命 名 。 


fun findroot (a, x, acc) = 
let val nextx = (a/x + x) / 2.0 
in if abs (x-nextx) < acc*x 
then nextx else findroot (a, nextx, acc) 
end; 
> val findroot = fn : (real * real * real) -> real 


函数 sqrooit 使 用 适当 的 初 值 来 调用 findroot。 


fun sqroot a = findroot (a, 1.0, 1.0E710); 
> val sqroot = fn : real -> real 
sqroot 2.0; 

> 1.414213562 : real 

it* it; 

> 2.0 : real 
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谋 套 的 函数 声明 。 我 们 的 平方 根 函 数 仍 不 够 理想 。 参 数 a 和 acc 毫 无 变化 地 在 每 次 递归 调 
用 findroot 的 时 候 传 递 着 。 相 对 于 findroot， 它 们 应 该 是 全 局 的 ， 这 样 更 有 效 、 更 清楚 .。 
, 增加 一 层 let 声 明 将 findrooit 岁 在 sgroot 里 面 。 首 先 声 明 精 度 acc， 使 它 在 findroot 中 是 可 见 
的 ， 参 数 a 当然 也 是 可 见 的 。 


fun sqroot a = 、 
let val acc = 1.0E~10 
fun findroot x = 
let val nextx = (a/x + x) / 2.0 
in if abs (x-nextx) < acc*x 
then nextx else findroot nextx 


end 
in findroot 1.0 end; 
> val sgroot = fn : real -> real 


邵 同 我 们 从 ML 的 回应 所 知 ， 在 sgqroot 外 findroot 是 不 可 见 的 。 
大 多 数 声明 都 可 以 在 let 里 面 使 用 。 值 、 函 数 、 类 型 和 异常 都 是 可 以 声明 的 。 
什么 时 候 不 用 let。 考 虑 要 取得 Kx) 和 g(x) 的 最 小 值 。 当 然 可 以 将 这 些 量 用 let 来 命名 : 


let val a= fx 

val b=gx 
in 

if a<b then a else b 
end 


更 好 的 做 法 是 声明 一 个 函数 来 取得 两 个 实数 中 最 小 的 那个 : 

fun min(a,b) : real = if a<b then a else b; 
现在 min(f x, g x) 的 意思 非常 清楚 了 ， 因 为 min 计 算 了 一 个 人 们 非常 熟悉 的 东西 。 抓 住 每 个 机 会 
来 定义 有 意义 的 轰 数 ， 哪 怕 只 用 它们 一 次 。 
2.18 使 用 local 来 隐藏 声明 

local 声 明 很 像 let 表 达 式 : 

local D, in D: end 
这 个 声明 就 像 是 系列 声明 Di D; 一 样 ， 只 不 过 D1 只 在 D; 内 可 见 ， 在 外 面 不 可 见 。 贝 于 一 系列 的 
声明 会 被 看 作 是 一 个 声明 ， 因 此 D1, 和 D; 都 可 以 声明 多 个 名 字 。 

let 被 经 常 地 使 用 ， 而 1ocal 则 很 少 用 到 。local 的 唯一 用 途 就 是 隐藏 声明 。 回 想 计算 


非 波 那 外 数 的 ifib 和 fib。 函 数 itfib 只 应 该 被 /ib 调用: 
local 
fun itfib (n, prev, curr) : int = 


if n=1 then curr 
else itfib (n-1, curr, prev+curr) 
in 
fun fib (n) = itfib(n,0,1) 
end; 
> val fib = fn : int -> int 


在 这 里 ，lLocal 声 明 将 itpibp 变 为 jb 私有 的 了 。 
练习 2.20 上 面 我 们 使 用 1ocal 隐 藏 了 itfib。 为 什么 不 简单 地 将 iWib 侯 在 fib 之 内 呢 ? 对 比 一 下 
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上 面 对 findroot 和 sqroot 的 处 理 。 


练习 2.21 使 用 Let， 我 们 可 以 在 整数 平方 根 函 数 中 省 掉 费 时 的 平方 操作 。 编 写 一 个 introot 的 
变 体 ， 由 n 得 到 它 的 整数 平方 根 :， 并 和 差 n - 马 配 对 作为 序 偶 结果 。 这 只 需要 简单 的 乘法 和 除 
法 ， 一 个 优化 的 编译 器 可 以 将 它们 转换 为 位 操作 。 
2.19 联 立 声明 

一 个 联 立 声明 同时 定义 多 个 名 字 。 通 常 声明 是 彼此 独立 的 。 但 是 fun 声明 人 允许 递归 ， 因 
此 联 立 声明 可 以 引入 相互 递归 的 函数 。 

如 下 形式 的 val 声 明 

val Id; = E and .:.. and Id, = E, 
首先 对 表达 式 E1, .…, E, 求 值 ， 然 后 声明 标识 符 1d1, .…, 1d,， 让 它们 具有 相应 的 值 。 由 于 声明 在 


所 有 表达 式 求 值 结束 之 前 还 不 起 作用 ， 所 以 它们 的 顺序 是 无 关 紧 要 的 。 
下 面 我 们 声明 了 rz、e 和 2 的 自然 对 数 。 


val pi = 4.0 * Math.atan 1.0 
and e = Math.exp 1.0 
and log2 = Math.In 2.0; 


> pi = 3.141592654 : real 
> e = 2.718281828 : real 
> log2 = 0.693147806 : real 


只 用 一 个 输入 就 定义 了 三 个 名 字 。 这 个 联 立 声明 强调 了 它们 是 相互 独立 的 。 
让 我 们 定义 大 笨 钟 的 钟鸣 声 : 
val one = "BONG " 
> val one = "BONG " : string 
val three = one” one“one; 
> val three = "BONG BONG BONG " : string 
val five = three” one” one; 
> val five = "BONG BONG BONG BONG BONG " : string 


这 里 我 们 必须 依次 进行 这 三 个 声明 。 

联 立 声明 也 可 以 交换 名 字 的 值 : 

val one = three and three = one; 

> val one = "BONG BONG BONG " : string 

> val three = “BONG " : string 
当然 ， 这 么 干 有 点 不 太 正常 ， 不 过 它 却 体 现 出 声明 是 同时 进行 的 。 如 果 是 顺序 进行 的 话 就 会 
峨 予 one 和 three 相 同 的 绑 定 。 

相互 递归 的 函数 。 有 些 函 数 是 相互 递归 的 (mutually recursive)， 它 们 是 相互 基于 对 方 来 
递归 定义 的 。 递 归 下 降 语 法 分 析 器 就 是 个 典型 的 例子 。 这 种 语法 分 析 器 对 于 语法 里 面 的 每 一 
个 元 素 都 定义 一 个 函数 ， 而 大 多 数 的 语法 就 是 相互 递归 的 : ML 的 声明 可 以 包含 表达 式 ， 同 时 
表达 式 也 可 以 包含 声明 。 人 遍历 由 此 生成 的 语法 分 析 树 的 函数 也 将 是 相互 递归 的 。 

语法 分 析 和 树 都 会 在 本 书后 面 的 章节 中 讲述 。 这 里 举 一 个 简单 的 例子 ， 看 一 下 级 数 求 和 


a 1 Aloha, 一 一 一 -一 一 -一 -一 … 
4 3 5 7 4k+1 4k+3 
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通过 相互 递归 ， 和 的 最 后 一 项 可 以 是 正 的 也 可 以 是 负 的 : 
fun pos d = neg(d-2.0) + 1.0/d 
and neg d = if d>0.0 then pos(d-2.0) - 1.0/d 
else 0.0; 
> val pos = fn : real -> real 
> val neg = fn : real -> real 


这 一 下 声明 了 两 个 函数 。 我 们 看 到 级 数 慢 慢 地 收敛 了 : 


4.0 * pos(201.0); 
> 3.151493401 : real 
4.0 * neg(8003.0); 
> 3.141342779 : real 


相互 递归 的 函数 通常 都 可 以 借助 加 入 一 个 参数 来 合并 成 一 个 函数 : 
fun sum (d, one) = 


if d > 0.0 then sum(d-2.0, ~one) + one/d else 0.0; 
> val sum = fn : real * real -> real 


这 样 ，sum (4d,1.0) 返 回 和 pos (4d) 同样 的 结果 ， 而 sum(d,"1.0) 则 返回 和 neg (d) AERAR. 

仿真 goto 语 句 。 国 数 式 程序 设计 语言 和 过 程式 程序 设计 语言 要 比 你 想像 的 更 为 相像 。 任 
何 赋值 语句 和 goto 语 句 的 组 合 一 一 最 灯 糕 的 过 程式 代码 一 一 都 可 以 被 翻译 成 一 组 相互 递归 的 
函数 。 下 面 是 一 个 简单 的 例子 : 


var x := 0; y:= 0; z := 0; 

F: x := x+1; goto G 

G: if y<z then goto F else (y := x+y; goto H) 
H: if z>0 then (z := z-x; goto F) else stop 


为 每 一 个 标号 ，F、G 和 及 ， 声 明 相互 递归 的 函数 。 每 一 个 函数 的 参数 就 是 一 个 代表 其 全 部 变 
量 的 元 组 。 


fun F(x,y,z) = G(x+1,y,2) 
and G(x,y,z) = iff yc<z then F(x,y,z) else H(x,x+ty,z) 
and H(x,y,z) = if z>0 then F(x,y,z-x) else (x,y,z); 


> val F = fn : int * int * int -> int * int * int 
> val G 


fn : int * int * int -> int * int * int 
> val H 


fn : int * int * int -> int * int * int 


nom 1 


运行 前 ， 调 用 F(0, 0, 0) 赋 给 x、y 和 z 相 应 的 初 值 ， 并 返回 相当 于 过 程式 代码 所 得 到 的 结果 。 
F(0,0,0); 
> (1, 1, 0) : int * int * int 


函数 式 的 程序 是 引用 透明 的 ， 不 过 也 可 以 是 完全 不 透明 的 。 如 果 你 的 代码 变 得 和 上 面相 似 的 
话 ， 就 要 小 心 了 ! 


练习 2.22 下 面 的 声明 有 什么 作用 ? 
val (pi,log2) = (log2,pi); 


练习 2.23 考虑 在 n> 1 上 定义 的 数列 (P;) 


n-1 
Pols dR 
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44 R2 
(特别 地 ，P! = 1.) 用 ML 函数 表达 这 个 计算 。 它 的 效率 怎样 ? 有 没有 更 快 的 方法 来 计算 
P, 呢 ? 


模块 系统 初步 


工程 师 是 基于 设备 的 部 件 来 了 解 一 个 设备 的 ， 类 似 地 ， 可 以 通过 基于 部 件 的 子 部 件 来 了 
解 部 件 。 自 行车 有 轮子 ; 轮子 有 轴 ; 而 轴 有 轴承 ， 依 此 类 推 。 需 要 经 过 几 个 阶段 我 们 才能 看 
到 单独 的 金属 和 塑料 的 那个 层次 。 通 过 这 种 方式 ， 就 可 以 在 一 个 抽象 的 层次 上 来 了 解 整个 自 
行车 ， 也 可 以 详细 地 了 解 它 的 部 件 。 工 程 师 一 般 都 是 通过 改装 其 中 的 某 个 部 件 来 改善 设计 ， 
而 不 用 同时 考虑 其 他 部 件 。 

程序 (要 比 自 行车 复杂 得 多 ! ) 也 应 该 被 看 作 是 由 部 件 组 成 的 。 传 统 上 ， 子 程序 就 是 一 
个 过 程 或 者 函数 ， 但 是 这 些 组 件 都 太 小 了 ， 就 像 是 把 自行 车 看 成 是 由 千 百 块 各 种 各 样 的 金属 
组 成 的 一 样 。 许 多 近期 的 语言 把 程序 看 作 是 由 模块 (module) 组 成 的 ， 每 个 模块 都 定义 了 自 
已 的 数据 结构 和 相关 操作 。 每 个 模块 的 接口 也 都 是 与 模块 本 身分 开 进行 描述 的 。 因 此 ， 不 同 
的 模块 可 以 由 项 目 组 的 不 同 成 员 编写 ， 而 编译 器 可 以 检测 每 个 模块 是 否 符合 它 的 接口 描述 。 

看 看 我 们 关于 向 量 的 例子 。 国 数 xaddvec 单 独 提出 来 没什么 用 处 ， 它 必须 和 其 他 的 向 量 操 
作 一 起 使 用 ， 这 些 操作 共享 了 向 量 的 表达 方式 。 我 们 可 以 猜测 其 他 操作 是 相关 的 ， 因 为 它们 
的 名 字 都 以 vec 结 尾 的 ， 但 是 并 没有 什么 来 强制 这 种 命名 协定 。 它 们 应 该 组 合 在 一 起 形成 一 个 
程序 模块 。 . 

MEL 的 结构 (structure) 将 相关 的 类 型 、 值 以 及 其 他 的 结构 组 合 在 一 起 ， 遵 守 一 个 统一 的 
命名 准则 。MEL 的 签名 (signature) 则 通过 列 出 每 个 组 件 中 的 名 字 和 类 型 (或 者 其 他 的 属性 ) 
描述 了 一 类 结构 。 

在 其 他 的 语言 中 ， 也 有 类 似 Standard ML 中 的 签名 和 结构 的 概念 ， 比 如 Modula-2 中 的 定义 
和 实现 模块 (Wirth, 1985). MLER: $F (functor) 以 其 他 结构 作为 参数 的 结构 
不 过 我 们 将 这 些 推 到 第 7 章 再 讲 。 


2.20 复数 


很 多 数学 对 象 是 可 以 进行 加 减 乘 除 运算 的 。 除 了 熟悉 的 整数 和 实数 以 外 ， 还 有 有 理 数 、 
和 矩阵、 多 项 式 等 。 我 们 下 面 的 例子 将 是 复数 ， 它 在 科学 数学 中 是 很 重要 的 。 我 们 将 复数 的 算 
术 运 算 通过 结构 Complex 瘘 在 一 起 ， 然 后 为 Compilex 声 明 一 个 签名 ， 这 个 签名 也 符合 任何 其 他 
声明 了 同样 算术 运算 的 结构 。 这 将 提供 一 个 泛 型 算术 运算 的 基础 。 
我 们 先 来 简单 地 介绍 一 下 复数 。 一 个 复数 (complex number) 形 如 x + yy， 其 中 ，x 和 y 是 
实数 ， 而 i 是 一 个 规定 满足 六 = -1 的 常数 。 这 样 ，x 和 7 就 确定 了 一 个 复数 。 
复数 零 是 0 + i0。 两 个 复数 的 和 由 相应 的 x 和 y 的 和 组 成 ; 它们 的 差 也 是 类 似 的 。 积 和 倒数 
的 定义 看 上 去 复杂 些 ， 但 通过 代数 定律 以 及 公理 = -1 也 不 难 确定 : 
(x + iy) + (x' + iy') = (x + x') + iO + y’) 
(x + ty) - (x' + iy) =(x-x)+ iO- y) 
(x + iy) x (x + ty’) = (xx' — yy') + i(xy' + x'y) 
1/(x + iy) = (x - iy) / (e+ y°) 
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在 上 面 的 倒数 中 ，y 部 分 是 -y/(x* + yy)。 我 们 现在 可 以 将 复数 的 商 z/z' 定 义 为 z x (1/z')。 
像 定 义 向 量 那样 ， 我 们 可 以 通过 下 面 的 定义 来 实现 复数 
type complex = real*real; 
val complexzero = (0.0, 0.0); 


不 过 ， 最 好 还 是 使 用 结构 。 


(©| 进一步 的 阅读 。Penrose (1989) 更 为 详尽 地 解释 了 复数 系统 ， 给 出 了 大 量 的 动 
机 和 例子 。 他 讨论 了 复数 和 分 形 之 间 的 联系 ， 包 括 了 一 个 Mandelbrot 集 合 的 定义 。 在 
书 的 后 面 ， 复 数 在 其 量子 力学 的 讨论 中 扮演 了 主要 的 角色 。Penrose 赋 子 了 复数 一 种 
形而上学 的 意义 ， 不 过 这 个 也 许 不 可 全 信 ! Feynman 等 (1963) 在 第 22 章 给 出 了 一 个 
更 技术 性 的 ， 但 是 非常 出 色 且 章 心 悦目 的 关于 复数 的 描述 。 


2.21 结构 


声明 可 以 被 包含 在 关键 字 struct 和 end 之 间 来 组 合 在 一 起 形成 一 个 结构 。 这 个 组 合 的 结 
果 可 以 通过 structure 结 构 声 明 绑 定 到 一 个 标识 符 上 : 


structure Complex = 


struct 
type t = real*real; 
val zero = (0.0, 0.0); 


fun sum ((x,y), (x,y)) 
fun diff ((x,y), (x,y)) 
fun prod ((x,y), (x,y)) 
fun recip (x,y) 


(+x, yty) 2 t; 
(Xx, yy) 2 ft: 
(Kx yey, xy + ty) : ts 


How uot 


let val ft = x*x + y*y 
in (x/t, “y/t) end 


fun quo (z,z) prod(z, recip Z); 


end; 


当 结 构 Complex 可 见 时 ,其 组 件 可 以 通过 复合 名 字 来 访问 ,例如 Complex .zero 和 Complex . sum. 
在 结构 体内 ,组 件 通 过 原 有 的 标识 符 来 访问 ， 例 如 zero 和 sum， 可 以 留意 一 下 在 声明 quo 的 时 
候 所 使 用 的 recip。 复 数 的 类 型 是 Complex .1。 如 果 声 明 结 构 的 目的 在 于 定义 一 个 类 型 ， 那 么 这 
个 类 型 通常 都 命名 为 1。 

我 们 可 以 放心 地 使 用 短 名 字 。 它 们 不 会 和 其 他 结构 里 面 的 名 字 冲 突 。 标 准 库 非常 依赖 于 
这 一 点 ， 比 如 区 分 绝对 值 国 数 mmr.abs 和 Real .aps。 

让 我 们 试验 一 下 新 的 结构 。 声 明 两 个 ML 标识 符 ，i 和 a; 数学 家 一 般 会 将 它们 相应 地 写作 ; 
和 0.3。 


H 


val i = (0.0, 1.0) 
> val i = (0.0, 1.0) : real * real 
val a = (0.3, 0.0); 


> val a (0.3, 0.0) : real * real 


分 两 步 计算 a + i + 0.7， 结 果 应 该 等 于 1 + i。 最 后 ， 将 这 个 数 平方 得 到 2i: 


val b = Complex.sum(a,i); 
> val b = (0.3, 1.0) : Complex.t 





46 #2 È 


Complex.sum(b, (0.7, 0.0)); 

> (1.0, 1.0) : Complex.t 

Complex . prod (it, it) ; 

> (0.0, 2.0) : Complex.t 
我 们 看 到 Complex .t 和 real x real 的 类 型 是 一 样 的 ， 更 为 混乱 的 是 ， 它 和 之 前 的 vec 类 型 也 是 一 
样 的 。 第 7 章 描述 了 如 何 定义 抽象 类 型 (abstract type) ， 其 内 部 表示 是 隐藏 的 。 

结构 看 来 和 记录 有 点 像 ， 但 它们 有 很 大 的 差别 。 记 录 的 组 成 部 分 只 能 是 值 (也 许 包含 其 
他 记录 )。 而 结构 的 组 成 部 分 则 可 以 包括 类 型 和 异常 (当然 也 可 以 是 其 他 的 结构 )。 然 而 ， 你 
却 不 能 用 结构 来 进行 计算 ， 因 为 只 有 在 程序 模块 进行 连接 的 时 候 才 会 创建 结构 。 结 构 应 该 被 
看 作 是 一 种 封装 了 的 环境 。 


2.22 签名 


签名 是 结构 里 面 每 一 个 组 件 的 描述 。 在 对 结构 Complex 作 出 声明 之 后 ，ML 通 过 打印 出 它 
所 导出 的 相应 的 签名 来 作为 回应 : 


structure Complex = ...; 
> structure Complex : 


> Sig 

> type t 

> val diff : (real * real) * (real * real) -> t 
> val prod : (real * real) * (real * real) -> t 
> val quo : (real * real) * (real * real) -> t 
> val recip : real * real -> real * real 

> val sum : (real * real) * (real * real) -> t 
> val zero : real * real 

> end 


关键 字 sig 和 end 括 住 了 签名 体 。 它 显示 了 所 有 值 的 类 型 ， 也 提 到 了 类 型 + (有 些 编译 器 显示 
eqtype 七 ， 而 不 是 type 七 ， 来 提示 ! 是 一 个 所 谓 的 相等 类 型 。) 

由 ML 编译 器 导出 的 签名 往往 不 是 最 适合 我 们 使 用 的 。 结 构 里 面 可 能 包含 一 些 应 该 是 私有 
的 定义 。 通 过 声明 我 们 自己 的 签名 ， 同 时 去 掉 那 些 私 有 的 名 字 ， 就 可 以 将 它们 隐藏 起 来 ， 而 
不 被 结构 的 使 用 者 看 到 。 比 如 ， 这 里 我 们 可 能 需要 隐藏 recip。 

上 面 打印 出 来 的 签名 有 时 将 复数 类 型 表示 为 :， 有 时 又 表示 为 real x real。 如 果 到 处 都 使 用 
t， 我 们 将 得 到 一 个 通用 的 签名 ， 它 描述 了 类 型 !:， 以 及 相关 的 运算 sum、prod 等 : 


signature ARITH = 
sig 
type t 
val zero : t 
val sum : t 
val diff : t 
t 
t 


+ + + + 


val prod : 

val quo : 

end; 
LAERE FARTHER TUM Esigiend z AREA. RANET AE LRR EE 
它们 遵守 签名 4RITH。 这 里 是 一 个 有 理 数 结构 的 框架 : 


structure Rational : ARITH = 
struct 


t t 
t t 
t -> t 
t t 
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int* int; 
(0, 1); 


type t 
val zero 


end; 


签名 描述 了 那些 ML 想 安 全 地 将 程序 单元 连接 起 来 所 需 的 信息 。 它 不 能 描述 组 件 实际 上 是 做 什 
么 的 。 有 具有 出 色 文 档 的 签名 包含 了 描述 每 个 组 件 目的 的 注释 。 而 描述 组 件 实现 的 注释 应 该 放 在 
结构 中 ， 而 不 是 签名 里 。 签 名 可 以 通过 多 种 方式 组 合成 新 的 签名 ， 结 构 也 可 以 有 类 似 的 组 合 。 

MEL 的 国 子 可 以 表示 证 型 模块 : 例如， 一 个 能 接受 任何 遵守 签名 ARITH 的 结构 的 模块 。 标 
准 库 为 这 方面 提供 了 广泛 的 可 能 性 。ML 系 统 可 以 提供 多 种 精度 的 浮 点 数 ， 只 要 结构 与 签名 
FLOAT 匹 配 。 数 值 算法 可 以 编码 成 函 子 。 将 该 函 子 应 用 到 某 个 精度 的 浮 点 数 结构 上 ， 就 能 构 
造 出 该 精度 上 的 数值 算法 实例 。 由 此 来 说 ，ML 拥 有 面向 对 象 语言 ， 比 如 C++ 的 一 些 功 能 一 一 
不 过 是 以 一 种 更 严格 的 形式 ， 因 为 结构 并 不 是 可 计算 的 值 。” 


练习 2.24 ”声明 一 个 结构 Real， 遵 守 签 名 ARITH， 也 就 是 说 ，Real .1 就 是 类 型 real， 生 组 件 
zero、sum、prod 等 代表 了 相应 的 实数 运算 。 


练习 2.25 ”完成 上 面 的 有 理 数 结构 声明 ， 此 声明 要 基于 定律 n/d + nVd' = (nd' + n'd)/dd'，(n/d) 


x (n'/d') = nnVdd' 以 及 1/(n/d) = din。 利 用 gcd 函 数 来 保持 最 简 分 式 ， 并 保证 分 母 永远 是 正 的 。 
多 态 类 型 检测 


直到 最 近 ， 对 于 类 型 检测 的 争论 一 直 在 僵持 着 ， 主 要 有 两 个 强硬 的 立场 : 

。 弱 类 型 语言 像 Lisp 和 Prolog 给 予 程 序 员 在 书写 大 型 程序 时 所 需要 的 自由 。 

*。 强 类 型 语言 像 Pascal 通 过 限制 程序 员 的 自由 使 他 们 少 犯错 误 以 提供 安全 性 。 

多 态 类 型 检测 提供 了 一 个 新 的 立场 : 既 有 强 类 型 的 安全 性 ， 同 时 也 非常 灵活 方便 。 程 序 
里 不 再 堆 满 了 类 型 描述 ， 因 为 大 多 数 类 型 信息 都 是 自动 推导 出 来 的 。 

类 型 表示 了 值 的 集合 。 函 数 的 参数 类 型 规定 了 哪些 值 是 可 以 作为 参数 的 。 其 结果 类 型 则 
说 明了 哪些 值 是 可 作为 结果 被 函数 返回 的 。 因 此 ，div 若 用 一 对 整数 作为 参数 的 话 ， 其 返回 结 
果 也 只 能 是 整数 。 如 果 除 数 为 0 的 话 则 根本 没有 结果 : 取代 结果 的 是 一 个 错误 信息 。 就 算是 在 
这 种 意外 情况 下 ， 函 数 div 也 是 忠实 于 它 的 类 型 的 。 

ML 也 可 以 赋予 恒 等 函 数 (identity function) 以 类 型 ， 使 这 个 函数 直接 返回 它 的 参数 。 因 
为 恒 等 函数 可 以 应 用 在 任何 类 型 的 参数 上 ， 所 以 它 是 多 态 的 (polymorphic )。 总 的 来 说 ， 如 
果 一 个 对 象 具 有 多 种 类 型 ， 那 么 它 就 是 多 态 的 。ML 的 多 态 性 是 基于 类 型 模式 (type scheme) 
的 ， 这 类 似 于 类 型 的 模式 或 模板 (template )。 例 如 ， 恒 等 函数 具有 类 型 模式 : a-a. 


2.23 ”类 型 推导 
在 没有 或 几乎 没有 显 式 类 型 信息 的 情况 下 ，ML 可 以 推导 出 函数 声明 涉及 到 的 所 有 类 型 。 


类 型 推导 是 顺 着 自然 而 严格 的 过 程 进行 的 。ML 标 记 出 所 有 常量 的 类 型 ， 并 且 将 类 型 检测 规则 . 


应 用 到 每 种 形式 的 表达 式 上 。 在 整个 声明 中 ,不 同 地 方 出 现 的 同一 变量 要 具有 相同 的 类 型 。 


O ”C++ 的 程序 员 可 能 已 经 注意 到 了 ， 这 种 泛 型 程序 设计 的 设施 类 似 于 C++ 中 的 模板 。 不 过 ， 作 者 在 写 这 本 书 
的 时 候 C++ 大 类 还 没有 像 现在 这 么 成 熟 。 一 一 译 者 注 
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重 载 的 操作 符 〈 像 +) 的 类 型 则 必须 根据 上 下 文 来 确定 。 

下 面 是 条 件 表达 式 的 类 型 检测 规则 。 如 果 E 具 有 bool 类 型 、 且 E, 和 Es; 具 有 相同 的 类 型 ， 比 
如 Tt， 那么 

if E then E, else Fp 
也 具有 类 型 rz。 否则 ， 该 表达 式 就 会 出 现 类 型 错误 。 

让 我 们 逐步 地 分 析 facii 的 类 型 检测 : 


fun facti (n,p) = 
if n=0 then p else facti(n-1, n*p); 


常量 0 和 1 具有 int 类 型 。 由 于 n = 0 和 nn - 1 都 涉及 到 了 整数 ， 因 此 nn 也 具有 int 类 型 。 现 在 n*p 必 

定 是 整数 乘法 了 ， 所 以 p 也 具有 int 类 型 。 因 为 p 是 facti 的 返回 结果 ， 所 以 范 数 的 结果 类 型 是 int， 

而 参数 类 型 是 int x int。 这 个 分 析 方 法 也 适用 于 递归 调用 。 经 过 所 有 的 这 些 检测 ，ML 可 以 回应 
> val facti = fn : int * int -> int 

如 果 这 些 类 型 不 一 致 的 话 ， 编 译 器 就 拒绝 这 个 声明 。 

练习 2.26 叙述 ; 态 2 的 类 型 检测 步骤 。 


练习 2.27 检测 下 面 函 数 声 明 的 类 型 : 
fun f (kım) = if k=0 then 1 else f(k-1); 


2.24 多 态 函 数 声明 


如 果 类 型 推导 还 剩 下 一 些 无 约束 的 类 型 ， 那 么 声明 就 是 多 态 的 ， 通 俗 地 说 ,“ 具 有 多 种 形 
态 *。 大 多 数 多 态 函 数 都 涉及 序 偶 、 表 和 其 他 数据 结构 。 它 们 通常 都 是 做 一 些 简单 的 事情 ， 例 
如 将 一 个 值 和 它 自己 配对 : 

fun pairself x = (x,x); 

> val pairself = fn : ‘a -> ‘a * ‘a 
这 个 类 型 是 多 态 的， 因为 里 面包 含 了 类 型 变量 (type variable)， 命 名 为 'a。 在 ML 里 ， 类 型 变 
EARS (8515) 开始 。 

'b ‘C ‘we_band_of_brothers “3 
让 我 们 用 wc、8、y 来 代表 ML 的 类 型 变量 'a、'b、'c， 因 为 传统 上 类 型 变量 是 用 希腊 字母 表 
示 的 。 书 写 x : HAR RATA”, 例如，pairself: a> (cx 0)。 有 顺便 提 一 下 ，x 比 一 的 优先 
级 高 ; pairself 的 类 型 可 以 写作 ac ax a 

多 态 类 型 是 一 个 类 型 模式 。 用 类 型 去 替换 类 型 变量 形成 了 一 个 类 型 模式 的 实例 (instance). 
一 个 具有 多 态 类 型 的 值 可 以 具有 无 限 多 的 类 型 。 当 pairself 应 用 到 实数 上 时 ， 它 实际 是 具有 类 
刑 real 一 real x real 的 。 


pairself 4.0; 
> (4.0, 4.0) : real * real 


WAI-A E, pairselfgttR FRA R Mint > int x int, 


pairself 7; 
> (7, 7) : int * int 
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下 面 pairsel] 应 用 到 一 个 序 偶 上 ， 结 果 称 为 pp。 


val pp = pairself ("Help!",999); 
> val pp = (("Help!", 999), ("Help!", 999)) 


> : (string * int) * (string * int) 
投影 函数 返回 序 偶 的 一 个 分 量 。 函 数 /rr 返回 第 一 个 分 量 ， 函 数 wnd 返 回 第 二 个 : 
fun fst (x,y) = x: 
> val fst = fn : ‘a* 'b -> ‘a 
fun snd (x,v) = y; 
> val snd = fn : ‘a * ‘b -> 'b 
在 考虑 它们 的 多 态 类 型 之 前 ， 我 们 先 把 它们 应 用 到 pp 上 : 
fst pp; 
> ("Help!", 999) : string * int 
snd (fst pp); 
> 999 : int 


所 的 类 型 是 a x 6 一 a，、 里 面 有 两 个 类 型 变量 。 参 数 序 偶 可 以 涉及 任意 两 个 类 型 志和 5，( 不 一 定 
要 不 同 )， 而 结果 只 具有 类 型 。 . 

多 态 函 数 可 以 用 来 表示 其 他 函数 。 从 ((x, y), mw) 返 回 x 的 函数 可 以 直接 编写 ， 也 可 以 连续 应 
用 两 次 fst: 

fun fstfst z = fst (fst z); 


> val fstfst = fn: (’a * ‘b) * ‘c -> ‘a 
fsifst pp: 
> "Help!" : string 


我 们 应 该 知道 fstfs! 的 类 型 是 (a x p) x ya。 注意 一 点 ， 多 态 函 数 在 同一 个 表达 式 的 不 同 地 方 可 
以 有 不 同 的 类 型 。 上 面 的 内 层 fit 具 有 类 型 (a x 有 x yo (ax B)， 而 外 层 的 st 则 具有 类 型 a x Ba. 
现在 来 点 奇怪 的 看 看 : 下 面 的 函数 在 做 什么 ? 


fun silly x = fstfst (pairself (pairself x)); 
> val silly = fn : ‘a -> ‘a 


其 实 也 没 干 什么 : 


silly "Hold off your hands."; 
> "Hold off your hands." : string 


它 的 类 型 ，a 一 a， 暗示 了 silly 是 一 个 恒 等 函 数 。 这 个 函数 可 以 更 为 直接 地 表达 为 : 


fun lx = x; 
> val I= fn: ʻa -> ‘a 


O| 进一步 的 阅读 。Milner (1978) 给 出 了 一 个 多 态 类 型 检测 的 算法 ， 并 且 证 明了 
一 个 类 型 正确 的 程序 不 会 遭受 运行 时 类 型 错误 的 困扰 。Damas 和 Milner (1982) ° 

还 证 明了 这 个 算法 推导 出 的 类 型 是 基本 的 (principal): 类 型 是 尽 可 能 多 态 的 。 
CardellifeWegner (1985) 较 全 面 地 评述 了 多 态 性 的 几 种 实现 方法 ， 对 于 Standard 

ML 来 说 是 相当 复杂 的 。 


O 根据 作者 的 勘误 表 : 这 篇 文章 仅 给 出 了 证 明 的 框架 ,证明 本 身 在 Damas (1985) 的 博士 论文 中 。 
一 一 译 者 注 
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相等 测试 在 有 限 的 程度 上 是 多 态 的 : 它 为 大 多 数 (但 不 是 全 部 ) 的 类 型 进行 了 
ZA. Standard ML 提供 了 一 类 相等 类 型 变量 (equality type variable) 来 概括 这 些 被 
限制 的 类 型 。 见 3.14 节 。 

回想 一 下 某 些 内 置 的 函数 是 重 载 的 : 比如 同时 为 整数 和 实数 定义 了 加 法 (+). 
重 载 和 多 态 性 相处 不 易 。 它 将 类 型 检测 的 算法 复杂 化 了 了， 并且 经 常 要 求 程序 员 书写 
类 型 约束 。 幸 亏 只 有 几 个 重 载 函数 。 而 程序 员 是 不 能 引入 更 多 重 载 的 。 


要 点 小 结 


。 变 量 代表 某 个 值 ， 它 可 被 再 声明 ， 但 不 能 被 更 新 。 
。 基 本 的 值 具有 类 型 int、real、char、string 或 bool。 
© 任何 类 型 的 值 都 可 以 组 合成 元 组 和 记录 。 
。 数 值 运算 可 以 被 表示 成 递归 函数 。 
。 迭代 图 数 以 有 限 的 方式 使 用 递归 ， 其 中 递归 调用 基本 上 只 是 跳 转 。 
。 结构 和 签名 可 以 为 组 织 大 的 程序 服务 。 
。 多 态 类 型 是 包含 类 型 变量 的 类 型 模式 。 
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在 一 次 公开 演讲 中 ，C. A. R. Hoare (1989a) 描述 了 他 的 一 个 算法 ， 用 来 在 一 堆 整 数 中 寻 
找 第 i 小 的 整数 。 这 个 算法 很 精巧 ， 不 过 Hoare 通 过 将 它 比 喻 成 一 个 纸牌 游戏 而 把 算法 叙述 得 
非常 清楚 ， 邻 人 叹服 。 每 一 张 纸牌 代表 一 个 整数 ， 将 纸牌 根据 规则 从 一 堆 移 到 另 一 堆 ， 可 以 
很 快 找到 满足 要 求 的 那个 整数 。 

然后 Hoare 改 变 了 游戏 的 规则 。 每 一 张 纸牌 占据 一 个 固定 的 位 置 ， 并 且 仅 有 的 移动 是 和 另 
一 张 纸牌 交换 位 置 。 这 就 是 在 叙述 基于 数组 的 算法 了 。 数 组 具有 很 高 的 效率 , 但 也 是 有 代价 的 。 
数组 可 能 会 难 倒 大 部 分 的 听众 ， 如 同 它 会 难 倒 富 有 经 验 的 程序 员 一 样 。Mills 和 Linger (1986) 
声称 如 果 数 组 仅 限于 栈 、 队 列 等 没有 下 标 寻 址 的 操作 的 话 ， 程 序 员 可 以 变 得 更 有 成 效 。 

函数 式 程序 员 通 常用 表 来 处 理 数 据 的 京 合 。 就 像 Hoare 的 那 司 纸牌 ， 表 只 允许 每 次 处 理 一 
个 数据 项 ， 这 是 非常 清晰 的 。 表 是 很 容易 从 数学 的 角度 去 理解 的 ， 并 且 实 际 上 比 通常 想像 中 
的 要 高 效 。 


本 章 提要 


本 章 叙 述 了 怎样 在 Standard ML 中 进行 关于 表 的 程序 设计 。 它 提供 了 几 个 通常 涉及 到 使 用 
数组 的 例子 ， 例 如 和 矩阵 操作 和 排序 。 

本 章 包 括 了 以 下 几 节 : 

。 表 的 简介 。 介 绍 了 表 的 记 法 。Standard ML 是 通过 模式 匹配 来 对 表 进 行 操作 的 。 

“基本 的 表 函 数 。 介 绍 了 一 系列 的 函数 。 这 些 都 是 对 表 的 程序 设计 具有 指导 性 的 例子 ， 也 

是 解决 更 难 的 问题 时 所 不 可 缺少 的 。 

。 表 的 应 用 。 一 些 逐 渐 深入 的 例子 讲述 了 可 以 利用 表 来 解决 的 多 种 问题 。 

。 多 态 汤 数 中 的 相等 测试 。 通 过 例子 介绍 和 演示 了 相等 的 多 态 性 。 其 中 包括 了 一 组 实用 的 

有 限 集 合 上 的 函数 。 

“排序 : 案例 分 析 。 过 程式 程序 设计 和 函数 式 程序 设计 在 效率 上 的 比较 。 在 一 个 试验 中 ， 

过 程式 程序 仅 比 清晰 得 多 的 函数 式 程序 快 一 点 儿 。 

“多 项 式 算术 。 计 算 机 可 以 解 代数 问题 。 以 符号 的 形式 利用 表 来 进行 多 项 式 的 加 法 、 乘 

法 和 除法 。 


表 的 简介 


A (list) 是 一 个 有 限 的 元 素 序列 。 典 型 的 表 如 [3,5,9] 和 [ "fair", "Ophelia"]。 
空 表 ，[]， 里 面 没有 任何 元 素 。 元 素 的 顺序 是 有 意义 的 ， 并 且 元 素 可 以 重复 出 现 。 例 如 ， 下 面 
的 表 是 互 不 相同 的 : 


{3,4] {4,3} [3,4,3] {3,3,4] 
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表 中 的 元 素 可 以 是 任意 类 型 的 ， 包 括 元 组 甚至 其 他 的 表 。 一 个 表 中 的 每 个 元 素 必 须 具 有 相同 
的 类 型 。 假 设 元 素 的 类 型 是 z， 那 么 表 的 类 型 就 是 it。 如 此 

[(1,"One"), (2,"Two"), (3,"Three")] : (int*string) list 

[ [3.1], [], (5.7, 70.6] ] : (real list) list 
空 表 ，[]， 具 有 多 态 类 型 a list。 可 以 把 它 看 作 具 有 任意 类 型 的 元 素 。 

注意 ， 类 型 操作 符 1is! 使 用 后 组 语法 。 它 比 x 和 一 的 优先 级 更 高 。 因 此 ， 类 型 int x string 
list 相 当 于 int x (string [ist)， 而 不 是 (int x string) list。 另 外 int list list 相 当 于 类 型 (int list) list. 


3.1 表 的 构造 
每 一 个 表 都 是 仅 由 两 个 原 语 构造 的 : 常量 nil 以 及 中 缀 操作 符 ::，、 读 作 “cons”， 意 思 是 构 


造 (construct). 
。nil 是 空 表 ，[]， 的 同义词 。 
。 操 作 符 :: 通过 在 已 有 的 表 前 加 入 一 个 元 素来 构造 一 个 新 的 表 。 
每 个 表 要 么 是 空 表 nil， 要 么 形 如 x :: !， 其 中 x 是 表 头 (head)，l 是 表 尾 (tail)。 表 尾 本 身 也 是 
一 个 表 。 表 的 操作 是 不 对 称 的 : 表 的 首 元 素 要 比 最 后 的 元 素 容 易 到 达 得 多 。 
如 果 ! 是 表 [x1, …, x,]， 并 且 x 是 具有 正确 类 型 的 值 ， 那 么 ，x :: WERE, x, s Xlo HE 
新 的 表 并 不 会 影响 ! 的 值 。 表 [3, 5, 9] 是 如 下 这 样 构造 的 : 
nil = [] 
9 :: [] = [9] 
5 :: [9] = [5, 9} 
3 :: [5, 9] = [3, 5, 9] 
可 以 看 到 ， 元 素 是 从 反方 向 放 进 去 的 。 表 [3, 5, 9] 可 以 写成 多 种 形式 ， 例 如 3 :: (5 :: (9 :: niD 或 
3 :: (5 :: [9]) 或 3 :: [5, 9]。 为 了 避免 总 是 写 括 号 ， 中 缀 操作 符 “cons” 被 定义 为 右 结 合 的 。 记 
法 Do ay sees Me RR TA og noe :Xn 并 元素 也 可 以 由 表达 式 给 出 ， 下 面 是 一 个 包含 多 个 
实数 表达 式 的 表 
[ Math.sin 0.5, Math.cos 0.5, Math.exp 0.5 ]; 
> [0.479425539, 0.877582562, 1.64872127] : real list 


表 的 记 法 可 以 构造 包含 固定 数目 元 素 的 表 。 看 一 下 怎样 构造 一 个 从 m 到 n 的 整数 的 表 : 
[m,m+1,...,nl 
首先 要 比较 m 和 n， 如 果 m 比 x 大， 那么 在 m 和 n 之 间 就 没有 数 ， 表 将 是 个 空 表 。 和 否则 ， 表 头 元 素 
是 m， 而 表 尾 则 是 表 [m + 1, …, n]。 道 归 地 构造 了 表 尾 之 后 ， 结 果 就 可 以 由 下 式 得 出 
m: {m+1,... n] 
这 个 过 程 对 应 于 下 面 这 个 简单 的 ML 函数 : 


fun upto (m,n) = 


if m>n then [{] else m :: upto(m+1,n); 
> val upto = fn : int * int -> int list 
upto (2,5); 


> {2, 3, 4, 5] : int list 
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Ol 其 他 语言 中 的 表 。 弱 类 型 语言 像 Lisp 和 Prolog 使 用 序 偶 来 表示 表 ， 比 如 
(3,(5,(9, "nil")))。 这 里 "nil" 是 一 种 结束 标记 ， 而 所 表达 的 是 表 [3, 5, 9]。 
这 种 表达 方式 在 ML 里 是 不 行 的 ， 因 为 这 样 的 话 ， 表 的 类 型 就 会 随 着 元 素 个 数 的 变化 
而 变化 。 那 样 的 话 ，Mpio 是 什么 类 型 呢 ? 

ML 里 的 表 的 语法 和 Prolog 里 的 有 微妙 的 差别 。 在 Prolog 里 面 ， 表 [5|[6]] 和 表 
[5,6] 是 一 样 的 。 而 在 ML 里 ，[5::[6]] 则 是 表 [ [5,6]]。 


3.2 表 的 操作 


表 ( 像 元 组 一 样 ) 是 一 


种 结构 值 。 在 ML 里 ， 元 组 上 的 国 数 可 以 将 它 的 参数 写成 一 个 模式 ， 


以 此 显示 出 参数 的 结构 ， 以 及 命名 结构 的 分 量 。 作 用 在 表 上 的 函数 也 可 以 类 似 地 书写 。 例 如 ， 


fun prodof3 (i,j,k) 


: int = i*j*k; 


声明 了 一 个 将 表 里 的 数 相 乘 的 国 数 ， 但 是 只 适用 于 恰好 有 三 个 数 的 表 ! 
表 的 操作 通常 是 递归 定义 的 ， 分 几 种 情形 来 处 理 。 怎 样 求 得 表 内 所 有 数 的 乘积 呢 ? 
。 如 果 表 是 空 的， 那么 积 就 是 1 〈 根 据 约 定 )。 
* 如 果 表 不 空 ， 那 么 积 就 是 表 头 乘 以 表 尾 的 积 。 


这 个 在 ML 中 可 以 这 样 表示 : 
fun prod [] =1 
| prod (n::ns) = n * (prod ns); 


> val prod = fn : 


prod{2,3,5]; 
> 30 : int 


int list -> int 


函数 声明 分 成 两 句 ， 用 竖 线 ( 
的 模式 ， 前 提 是 类 型 要 相同 。 由 于 模式 涉及 到 表 ， 而 结果 又 有 一 种 可 能 是 整数 1， 因 此 ML 推 
导出 prod 是 将 一 个 整数 表 映 射 到 一 个 整数 的 函数 。 


|) 分 开 。 每 一 个 分 句 处 理 一 个 模式 。 可 能 会 有 几 个 分 句 和 复杂 


最 常见 的 表 的 分 情 是 将 其 分 为 空 表 和 非 空 表 。 不 过 寻找 一 个 表 中 整数 的 最 大 值 这 样 的 问题 就 
有 点 不 同 了 ， 因 为 空 表 是 没有 最 大 值 的 。 对 于 这 个 问题 可 以 分 为 两 种 情况 
。 单 元 素 表 [m] 的 最 大 值 是 m。 
。 要 寻找 两 个 或 以 上 元 素 的 表 [m, n, .…] 的 最 大 值 , 只 要 从 表 中 删除 m 和 n 中 较 小 的 那个 元 素 ， 
然后 递归 地 寻找 剩 下 元 素 组 成 的 表 的 最 大 值 。 


根据 这 个 算法 得 到 了 ML 函数 


fun maxl [m] : int 
| maxl (m::n::ns) 


m 
if mon then maxl(m: :ns) 
else maxl(n::ns); 


> ***Warning: Matches are not exhaustive 
int list -> int 


EENEG A MI 检测 到 了 maxl 对 于 参数 为 空 表 的 情形 是 没有 定义 的 。 另 外 也 可 以 看 到 
模式 m :: n :: ns 是 如 何 描 述 形 如 [m,n, …] 的 表 的 。 较 小 的 元 素 在 递归 调用 时 被 去 掉 了 。 
se MLE 表 以 外 的 参数 都 起 作用 。 


> val maxl = fn : 
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maxl [ ~4, 0, 712); 
> 0 : int 

maxl {]; 

> Exception: Match 


异常 (exception)， 眼 下 可 以 被 看 作 是 个 运行 错误 。 异 党 是 因为 函数 maxl 被 应 用 到 了 一 个 它 没 
有 定义 的 参数 上 。 通 常 ， 异 常 都 会 终止 程序 运行 ， 不 过 它们 也 可 以 被 捕获 ， 关 于 这 方面 的 内 
容 将 在 下 一 章 介 绍 。 

中 间 (A) 表 。 有 时 在 计算 过 程 中 会 生成 及 使 用 一 些 表 。 例 如 ， 阶 乘 国 数 可 以 利用 
prod 和 upto 来 定义 : 


fun factl (n) = prod (upto (1,n)); 
> val factl = fn : int -> int 
factl 7; 


> 5040 : int 
这 个 声明 简练 而 清晰 ， 避 免 了 显 式 的 递归 。 构 造 表 [1, 2, … n] 的 开销 也 许 并 不 是 最 重要 的 。 重 
要 的 是 ， 国 数 式 程序 设计 应 该 促进 对 于 程序 正确 性 的 证 明 ， 而 这 一 点 在 这 里 没 体现 出 来 。 对 
于 阶乘 的 基本 定律 
factl(m + 1) = (m+ 1) x factl(m) 
并 没有 一 个 明显 的 证 明 。 展 开 函 数 的 定义 ， 我 们 有 
factl(m + 1) = prod(upto(1,m + 1))= 


下 一 步 并 不 清楚 ， 因 为 回 闫 upto 的 定义 ， 里面 的 递归 是 跟随 第 一 个 而 不 是 第 二 个 参数 的 。 那 
个 老 老实 实 的 递归 的 阶乘 函数 定义 看 来 更 加 清楚 。 

字符 串 和 表 。 表 在 字符 串 处 理 上 非常 重要 。 大 多 数 的 函数 式 语言 提供 字符 类 型 ， 然 后 将 
字符 串 看 作 是 字符 的 表 。 在 新 的 标准 库 中 ，ML 引 入 了 字符 类 型 ， 但 是 并 没有 把 字符 串 看 作 是 
表 。 内 置 函 数 explode 将 字符 串 转 换 成 字符 的 表 ， 而 函数 iaplode 则 进行 相反 的 操作 ， 将 表 中 的 
字符 按 顺 序 连 接 成 字符 串 。 

explode "Banquo"; 

> [#"B", #"a", #"n", #"g", #"u", #"0"] : char list 

implode it; 

> "Banquo" : string 


类 似 地 ， 函 数 concat 将 一 个 字符 串 表 中 的 所 有 成 员 连 成 一 个 字符 串 。 


BAAR BR 


给 定 一 个 表 ， 可 以 取得 它 的 长 度 、 提 取出 第 "个 元 素 、 取 得 前 绥 (前 一 部 分 ) 或 后 级 (后 
一 部 分 )， 以 及 翻转 元 素 的 顺序 。 给 定 两 个 表 ， 可 以 将 一 个 追加 到 另 一 个 后 面 ， 或 者 ， 如 果 它 
们 长 度 一 样 ， 可 以 将 相应 的 元 素 配 对 。 在 这 一 节 中 声明 的 函数 都 是 不 可 缺少 的 ， 并 将 在 本 书 
后 面 大 量 使 用 。 所 有 这 些 函 数 都 是 多 态 的 。 

这 里 效率 将 作为 重点 考虑 。 对 于 某 些 函数 ， 直接 的 递归 定义 不 如 渤 代 的 版 本 效率 高 ， 但 
对 于 另 一 些 函 数 ， 迹 代 的 方式 既 前 弱 了 可 读 性 也 降低 了 效率 。 
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3.3 表 的 测试 和 分 解 


三 个 基本 的 表 国 数 是 xl、Ppd 和 1。 
null 3%. IX ARMIR—-TRERESE: 


fun null [] = true 
| null (_::_) = false; 
> val null = fn : ‘a list -> bool 


ARES ASW: 测试 表 是 否 为 空 并 不 涉及 到 分 析 表 的 元 素 。 第 二 个 模式 中 的 下 划 线 (_) 是 一 
个 占 位 符 ， 表示 该 位 置 的 值 在 语 名 中 是 用 不 到 的 。 这 些 下 划 线 称 为 通配符 (wildcard)， 可 以 
使 我 们 不 必 为 用 不 到 的 部 分 起 名 字 。 

Ad 函数 。 图 数 返 回 非 空 表 的 表 头 元 素 ; 


fun hd (x::_) = x; 
> ***Warning: Patterns not exhaustive 
> val hd = fn : ‘a list -> ‘a 


这 个 模式 使 用 了 通配符 代表 表 尾 ， 而 表 头 命名 为 Y。 由 于 没有 代表 空 表 的 模式 ， 因 此 ML 打印 
出 了 警告 信息 。 像 max/ 一 样 ， 这 是 一 个 部 分 函数 。 
下 面 我 们 有 一 个 表 的 表 ， 它 的 表 头 本 身 是 一 个 表 ， 表 头 的 表 头 是 一 个 整数 。 每 次 使 用 hd 


都 会 去 掉 一 层 方 括号 。 
hdi [[1,2), {3]], [[4]}}); 
> [[1, 2], [3]] : (int list) list 
hd it; 
> [1, 2] : int list 
hd it 


> 1 : int 
如 果 再 来 一 次 pnd it; 会 怎样 ? 


tl 光 数 。 陵 数 返 回 非 空 表 的 表 尾 。 记 住 ， 表 尾 是 包含 了 除去 表 头 以 外 的 所 有 表 元 素 的 
子 表 。 


fun tl (_::xs) = xs; 
> ***Warning: Patterns not exhaustive 
> val tl = fn: ’a list -> ‘a list 


像 hd 一 样 ， 这 也 是 个 部 分 函数 ， 它 总 是 返回 男 一 个 表 : 


tl ("Out","damed","spot!"]; 

> ["damned", "spot!"] : string list 
tl it; 

> ["spot!"] : string list 


> [] : string list 


> Exception: Match 


tnau, hdfilel, PARA ARB TOA ERA CARBS. 计算 整数 表 内 所 有 元 素 
的 积 的 函数 可 以 这 样 写 : 


fun prod ns = if null ns then 1 
else (hd ns) * (prod (tl ns)); 
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如 果 你 喜欢 这 个 版 本 的 prod， 你 可 能 会 放弃 ML 而 选择 Lisp。 为 了 增加 清晰 性 ，Lisp 的 原 语 里 
面 有 CAR 和 CDR。 一 般 的 人 都 会 认为 模式 匹配 比 hd 和 4 更 清楚 。 好 的 ML 编译 器 可 以 通过 分 析 
一 系列 的 模式 来 给 函数 生成 最 好 的 代码 。 更 重要 的 是 ， 编 译 器 可 以 在 模式 没有 涵盖 函数 中 所 
有 可 能 的 参数 时 给 出 警告 信息 。 


练习 3.1 不 用 模式 匹配 ， 而 用 ml、Hncd 和 1 书写 图 数 maxl。 
练习 3.2 书写 一 个 返回 表 的 最 后 一 个 元 素 的 函数 。 


3.4 与 数量 有 关 的 表 处 理 
现在 来 声明 函数 length、take 和 drop。 它 们 的 功能 如 下 : 
l=[X0,., Kis Kivi, Xai] length(D=n 
一 一 一 一 一 一 
take(1j) arop(lj) 
length yk. PAK A AS BR: 


fun nlength {] = 0 
| nlength (x::xs) = 1 + nlength xs; 
> val nlength = fn : ’a list -> int 


它 的 类 型 a list 一 int， 表 明了 nleng 坟 可 以 应 用 到 包含 任何 类 型 元 素 的 表 上 。 我 们 把 它 用 在 一 个 
表 的 表 上 : 

nlength({1,2,3], [4,5,6]]; 

> 2 : int 
你 会 觉得 答案 应 该 是 6 吗 ? 

虽然 nlength 是 正确 的 9 ， 不 过 把 它 应 用 到 很 长 的 表 上 面 时 ， 其 浪费 的 空间 也 是 不 堪 忍 受 的 : 

nlength{1, 2, 3,... , 10000] = 1 + nlength[2,3,... , 10000] 
=> 1+ (1 + nlength(3, ... , 100001) 


=> 1+ (1 +9998) 

=> 1+ 9999 = 10000 
那些 “一 ”堆积 了 起 来 ， 浪 费 了 和 表 长 度 成 正比 的 空间 ， 并 且 可 能 导致 程序 异常 终止 运行 。 
迭代 版 本 的 函数 要 好 得 多 ， 它 利用 另 一 个 参数 来 进行 累加 : 


local 

fun addien (n, []) =n 

| addlen (n, x::l) = addlen (n+1, 1) 

in 

fun length | = addlen (0,1) 
end; 
> val length = fn : ‘a list -> int 
length (explode"Throw physic to the dogs!"); 
> 25 : int 


函数 addien 将 表 的 长 度 加 到 另 一 个 初 值 为 0 的 数 上 。 由 于 它 没有 别 的 用 途 ， 所 以 将 其 作为 
iength 的 局 部 声明 。 它 的 执行 过 程 是 : 


日 nlength 的 “n” 在 这 里 代表 naive， 暗 示 这 是 一 个 朴素 而 幼稚 的 实现 。 一 一 译 者 注 





addlen(0, [1, 2, 3,... , 10000]) = addlen(1, [2, 3, ... ,10000]) 
=> addlen(2, [3,... , 10000}) 


= addlen(10000, []) => 10000 
对 于 效率 的 显著 改善 补偿 了 可 读 性 上 的 不 足 。 
lake 函 数 。 调 用 Iake(1,D 返 回 由 表 ! 的 前 ; 企 元 素 组 成 的 表 : 


fun take ([], i) = [] 
| take (x::xs, i) = if i>0 then x: :take(xs, i-1) 


else []; 
> val take = fn : ’a list * int -> ‘a list 
take (explode"Throw physic to the dogs!", 5); 


> [#"T", #"h", #"r", #"o", #"w"] : char list 
下 面 是 一 个 计算 过 程 的 例子 : 


take([9, 8, 7, 6], 3) => 9 :: take((8, 7, 6], 2) 
= 9 :: (8 :: take({7, 6], 1)) 
=> 9 :: (8 :: (7 :: take([6}, 0))) 
39: (8: (7: [) 
=> 9:: (8:: [7]) 
=> 9 :: [8,7] 
= [9, 8, 7] 


我 们 看 到 9 :: (8 :: (7 :: []) 是 一 个 表达 式 而 不 是 一 个 值 。 对 这 个 表达 式 求 值 的 结果 是 构造 了 表 
[9, 8, 7]。 分 配 必需 的 空间 是 要 花 时 间 的 ， 特 别 是 还 要 考虑 到 后 来 所 引 至 的 垃圾 收集 的 时 间 。 
确实 ，take 花 费 了 大 部 分 的 时 间 用 来 构造 它 的 结果 。 
很 遗憾 ， 对 于 take 的 递归 调用 是 越 来 越 深 的 ， 就 像 刚才 的 niengt 专 一 样 。 让 我 们 再 尝试 写 一 
个 迭代 的 版 本 ， 把 结果 累积 在 另 一 个 参数 里 面 : 
fun rtake ([}, _, taken) = 
| rtake (x::xs, i, taken) = 
if i>0 then rtake(xs, i-l, x::taken) 
else taken; 
> val rtake = fn : ‘a list * int * ‘a list -> ‘a list 
这 个 函数 递归 得 很 浅 也 很 漂亮 …… 
rtake([9, 8, 7, 6], 3, [D = rtake({8, 7, 6], 2, [9]) 
=> rtake((7, 6), 1, [8, 9]) 
=> rtake([6], 0, [7, 8, 9]) 
=> [7, 8, 9] 


taken 


但 是 ， 结 果 却 是 倒 的 ! 

如 果 倒 过 来 的 结果 可 以 接受 的 话 ， 函 数 rtake 还 是 值得 考虑 的 。 不 过 ， 即 便 是 在 take 中 ， 
递归 的 大 小 同 输出 的 大 小 相 比 也 是 可 以 忍受 的 。 这 里 要 考虑 的 是 ，mieng 纺 返回 的 是 一 个 整数 ， 
而 take 返回 的 是 一 个 表 。 构 造 一 个 表 是 很 慢 的 ， 这 可 能 比 由 于 深度 递归 而 临时 消耗 的 空间 更 为 
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重要 。 讲 求 效 率 的 目的 是 要 将 开销 减少 到 合乎 比例 。 
drop 光 数 。drop(l, 站) 返回 的 表 包 含 了 表 ! 中 除去 前 i 个 元 素 以 外 的 其 余 元 素 : 
fun dp ([], -) = 0 l 
| drop (x::xs, i) = if i>0 then drop (xs, i-1) 


else x: 2x5; 
> val drop = fn : ‘a list * int -> ‘a list 


很 幸运 ， 这 里 的 递归 调用 显然 是 迭代 的 。 


take (["Never", "shall", "sun", "that", "morrow", "see!"], 3); 


> [{"Never", "shall", "sun"] : string list 
drop (("Never", "shall", "sun", "that", "morrow", "see!"], 3); 
> ["that", "morrow", "see!"] : string list 


练习 3.3 take(l, i) 和 drop(l, 站 在 i > length) Hi < 0 时 都 返回 什么 ? ( 库 函 数 版 本 将 产生 异常 。) 
练习 3.4 ” 写 一 个 nth(1, nn) 函数 ， 返 回 ! 中 的 第 个 元 素 ( 从 0 开始 计数 )。 
3.5 追加 和 翻转 

中 缀 操作 符 8 将 一 个 表 追 加 到 另 一 个 表 后 面 ; 函数 rev 将 一 个 表 翻 转 。 它 们 都 是 内 置 的 函 
数 ， 不 过 它们 的 定义 却 值 得 进行 详细 地 分 析 。 

追加 操作 。 追 加 是 将 一 个 表 的 元 素 加 到 另 一 个 表 的 后 面 : 

Xis Xn] @ [yy = is Xm Yis es Yal 

什么 样 的 递归 可 以 完成 这 个 呢 ? 传统 上 append 这 个 名 字 表 示 了 操作 是 在 一 个 表 的 后 面 发 生 的 ， 
但 是 我 们 的 表 却 总 是 要 从 前 面 来 构造 。 下 面 定 义 的 基本 思想 要 上 漳 到 Lisp 的 早期 : 


infixr 5 @; 


fun ([] @ ys) = ys 
| ((x::xs}) @ ys) = x :: (xs@ys); 
> val @ = fn : ‘a list * ‘a list -> ‘a list 


函数 的 类 型 是 a List x a lista list， 表 明 函 数 接受 两 个 元 素 类 型 相同 的 表 作为 参数 ， 比 如 ， 两 
个 字符 串 的 表 ， 或 是 两 个 (同类 型 的 ) 表 的 表 : 

["Why", "sinks"] @ ["that", "cauldron?"]; 

> ["Why", "sinks", "that", "cauldron?"] : string list 

({2,4,6,8], [3,91] @ [15], (711; 

> [[2, 4, 6, 8], (3, 9], [5], [7]] : int list list 


(2,4, 6] @ [8, 10] 的 计算 过 程 是 如 下 进行 的 : 


[2, 4, 6] @ {8, 10] > 2 :: ({4, 6] @ [8, 10]) 
=> 2 :: (4: (6] @ [8, 10])) 
=> 2 :: (4: (6:: ([] @ [8, 10)))) 
= 22 (4 :: (6 :: (8, 10)) 
= 2 :: (4 :: {6, 8, 10]) 
=> 2 :: {4, 6, 8, 10] 
=> {2, 4, 6, 8, 10] 





& 59 


后 面 的 那 三 步 把 第 一 个 表 的 各 元 素 放 在 了 第 二 个 表 前 面 。 和 ake 的 情形 一 样 ， 构 造 新 表 的 代价 
超过 了 递归 深度 所 付出 的 代价 ; 因此 迭代 的 版 本 就 不 必要 了 。 计 算 xs @ ys 的 开销 和 xs 的 长 度 
成 正比 ， 而 且 完 全 与 无关。 其 至 是 xs @ [也 会 将 Xs 复制 一 亡 。 

在 Pascal 和 C 中 ， 可 以 利用 指针 类 型 来 实现 表 类 型 ， 并 且 通 过 改变 其 中 一 个 表 的 尾 指针 ， 
让 它 指向 另外 一 个 表 ， 来 将 两 个 表 连 接 起 来 。 破 坏 性 的 更 新 比 复制 要 快 很 多 ， 但 是 如 果 不 小 
心 的 话 ， 你 的 表 就 会 有 麻烦 了 。 如 果 两 个 表 碰巧 是 同一 个 指针 来 表示 的 话 将 会 怎样 ML 的 表 
含有 使 用 安全 的 内 部 指针 。 如 果 你 喜欢 冒险 ，ML 也 有 显 式 的 指针 类 型 ， 详 见 第 8 章 。 


ML 的 表 的 内 部 表示 是 程序 员 很 熟悉 的 单 向 链接 表 ， 我 们 很 容易 怀疑 为 什么 连接 
两 个 表 的 开销 和 第 二 个 表 无 关 ? 既然 要 复制 ， 为 什么 不 复制 第 二 个 表 呢 ? 
假设 a = [2,4,6], b=[8,10], c=a@b, d=a@a: 
OA Or THT [yy 
OA OF Ty 
我 们 看 到 ，a 的 元 素 被 复制 到 了 b 和 a 的 前 面 分 别 形成 了 c 和 d， 当 然 4 没 受到 任何 
破坏 ， 同 时 bp、c 和 d 也 是 好 的 表 ，a、b、c 和 d 所 代表 的 值 都 存在 。 在 理解 函数 式 语言 
的 时 候 要 注意 把 重点 放 在 值 上 面 ， 而 不 是 内 存单 元 上 面 。 例 如 ， 尽 管 b 和 c 使 用 了 共 
同 的 内 存单 元 ， 但 它们 很 成 功 地 表达 了 两 个 值 。 一 个 值 不 同 于 内 存单 元 ， 它 的 总 体 
和 局 部 都 是 不 会 被 更 新 的 ， 所 以 共用 部 分 没有 问题 。 利 用 更 新 尾 指针 来 实现 连接 两 
个 表 的 Pascal 和 C 的 版 本 虽然 快 ， 却 使 4 原来 的 值 从 内 存 中 消失 了 (更 不 用 说 这 个 方法 
根本 不 能 构造 出 d)。 一 一 译 者 注 


revy 函 数 。 表 的 翻转 可 以 利用 追加 操作 来 定义 。 把 表 头 元 素 变 成 翻转 后 的 表 尾 : 
fun nrev {] = [] 
| nrev (x::xs) = (nrev xs) @ [x]; 
> val nrev = fn : ‘a list -> ‘a list 
这 样 做 的 效率 显然 是 很 低 的 。 如 果 nrev 的 参数 是 一 个 长 度 为 n(n > 0) 的 表 ， 追 加 操作 需要 调用 
cons(::) 正 好 n-1 次 来 复制 翻转 后 的 表 尾 。 构 造 表 [x] 也 需要 一 次 cons ， 总 共 需 要 n 次 调用 。 而 递 
归 翻 转 表 尾 又 需要 n-1 次 的 cons 调 用 ， 依 此 类 推 ， 最 终 需 要 的 cons 调 用 次 数 为 : 




















_ n(n+1) 
2 


0+1l+2+:…+n 


代价 是 二 次 的 : 和 成 正比 。 
我 们 在 rtake 里 面 已 经 看 到 了 另 一 种 翻转 表 的 方法 : 不 断 地 将 一 个 表 的 元 素 移 向 另 一 个 表 。 


fun revAppend ([]， ys) = ys 
| revAppend (x::xs, ys) = revAppend (xs, X::y5); 
> val revAppend = fn : ‘a list * ‘a list -> ‘a list 
这 里 没有 用 到 追加 操作 。 翻 转 的 步骤 数 和 要 翻转 的 表 的 长 度 是 成 正比 的 。 这 个 函数 类 似 追 加 
函数 ， 只 不 过 是 把 第 一 个 参数 给 翻转 了 。 
revAppend ({"Macbeth","and","Banquo"], ["all", “hail!"]); 
> ["Banquo", "and", "Macbeth", "all", "hail!"] : string list 
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较为 高 效 的 翻转 函数 调用 了 revAppend， 并 传 入 一 个 空 表 作 为 第 二 个 参数 : 


fun rev xs = revAppend(xs,[}); 
> val rev = fn : ‘a list -> ‘a list 


这 里 ， 较 长 的 定义 换 来 了 突出 的 效果 。 翻 转 一 个 1000 个 元 素 的 表 ，rev 只 要 调用 1000 次 ::， 而 
nrev 需 要 500 500 次 。 此 外 ，revAppend 里 的 递归 是 迭代 的 。 这 里 的 关键 思想 一 一 将 一 个 表 中 的 
元 素 积累 到 另 一 个 参数 上 ， 而 不 使 用 追加 一 一 适用 于 很 多 其 他 的 函数 。 

练习 3.5 修改 追加 函数 ， 使 得 它 能 高 效 地 处 理 xs @ [] 的 情形 。 

练习 3.6 如 果 我 们 在 nrev 的 定义 中 将 [x] 改 成 x 会 怎样 ? 

练习 3.7 分 别 给 出 使 用 nrev 和 rev 来 翻转 表 [1,2,3, 4] 的 计算 过 程 。 


3.6 表 的 表 ， 序 偶 的 表 


模式 匹配 和 多 态 性 可 以 很 好 地 处 理 数据 结构 的 组 合 。 观 察 一 下 下 面 这 些 函 数 的 类 型 。 
concal 函 数 。 这 个 函数 将 一 个 表 内 的 所 有 元 素 连 成 一 个 表 : 


fun concat [] [] 
| concat (l: :ls) l @ concat ls; 
> val concat = fn : ‘a list list -> ‘a list 
concat {("When","shall"], ["we","three"], ["meet","again"]]; 
> ["When", "shall", "we", "three", "meet", "again"] 
> : string list 
1 e concat ls 中 的 复制 过 程 应 该 是 很 快 的 ， 因 为 /通常 都 比 concat 1s 要 短 得 多 。 
zp 总 数 。 这 个 函数 将 两 个 表 中 的 对 应 元 素 配对 : 
zip([x1, sey Xaho by, sets yal) = E(x, y), cory (Xn Yn] 
如 果 两 个 表 的 元 素 个 数 不 等 ，zip 将 忽略 多 余 的 元 素 。 这 个 函数 的 声明 用 到 了 比较 复杂 的 模式 : 
fun zip(x::xs,y::ys) = (x,y) :: zip(xs, ys) 
| zip _ = []; 
> val zip = fn : ’a list * ‘b list -> (’a*’b) list 
z 记 定义 中 的 第 二 个 模式 使 用 了 通配符 ， 它 能 匹配 所 有 可 能 的 模式 。 但 是 这 个 通配符 只 有 在 第 
一 个 模式 匹配 失败 以 后 才 会 被 考虑 。ML 根 据 给 定 的 顺序 尝试 模式 匹配 。 
Hz 了 pb 函数 。 这 是 zzp 国 数 的 逆 函 数 ， 它 把 序 偶 的 表 转 换 成 表 的 序 偶 : 


unzip[ (xı, yı), (EEZ) (Xn, Yn} = (fx, sees Xl, Ly, sony yn]) 
在 函数 式 语言 里 同时 构造 两 个 表 可 能 需要 一 些 技巧 。 一 种 方法 是 利用 辅助 函数 : 
fun conspair ((x,y}, (xs,ys)) = (Xx: :Xs, yrrys); 


fun unzip [] = (f1,0)) 
| unzip (pair: :pairs) = conspair(pair, unzip pairs) ; 


在 一 个 let 声 明 中 利用 模式 匹配 来 将 递归 调用 的 结果 分 解 开 来 ， 就 可 以 省 去 这 个 conspair 了 : 


fun unzip [] (EJ. E) 
| unzip ( (x,y) : :pairs) 
let val (xs,ys) = unzip pairs 
in (x::xs, y::ys) end; 
> val unzip = fn : (‘a*’b) list -> ‘a list * ’b list 
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一 个 迭代 的 函数 可 以 同时 在 它 的 参数 中 构造 多 个 结果 。 这 是 unzip 一 个 表 的 最 简单 的 方法 ， 不 
过 返回 的 表 却 是 翻转 的 。 
fun revunzip({[]}, xs, ys) 


| rev.unzip((x,y)::pairs, xs, ys) 
rev_unzip (pairs, Xx: :xs, y::ys); 


(xs, ys) 


O | 表 和 标准 库 。 标准 库 提供 了 上 面 提 到 的 大 多 数 济 数 。 追 加 (中 缓 8)、 翻 转 (rev). 
null、hd、tl 和 length 剖 可 以 在 顶层 环境 中 使 用 。List 结 构 还 提供 了 take、drop 和 concat， 
以 及 其 他 浮 数 。ListPair 结 构 则 提供 了 zip 和 unzip。 

请 尽量 使 用 标准 库 提 供 的 这 些 函 数 。 我 们 自己 定义 的 函数 缺少 错误 处 理 。 库 函 
数 会 在 遇 到 错误 输入 的 情况 下 抛 出 异常 ， 例 如 List.Emapty (如 果 你 试图 提取 空 表 的 表 
头 元 素 ) 和 Subscript (如 果 你 试图 1ake 比 表 的 长 度 更 多 的 元 素 )。 库 函数 也 会 为 了 效 
率 而 进行 优化 。 


练习 3.8 将 下 面 的 函数 与 conrcat 进 行 比较 ， 看 看 它 的 作用 和 效率 : 


fun f [} = {] 
| f(t): sds) = f (ls) 
| fix: is) = x :: flscls); 


练习 3.9 ”给 出 zip 函 数 的 等 价 定 义 ， 要 求 和 模式 匹配 的 顺序 无 关 。 
练习 3.10 rev(rtake(!, i, []) 会 比 takell, i) 效 率 更 高 吗 ? 请 考虑 所 有 的 开销 。 


表 的 应 用 


这 一 节 演 示 了 怎样 利用 表 去 完成 相对 复杂 的 任务 ， 例 如 二 进 制 算术 和 和 拖 阵 操作 。 如 果 你 
愿意 的 话 ， 尽 管 跳 过 那些 较 难 的 例子 。 

这 里 也 解决 了 来 自 《A Discipline of Programming) (Dijkstra, 1976) 这 一 经 典 著 作 中 的 
两 个 问题 。Dijkstra 展 示 了 程序 “ 令 人 叹服 的 、 深 刻 理 性 的 美 ”。 他 的 程序 使 用 的 是 数组 ， 表 
会 不 会 更 具 美 感 呢 ? 


3.7 RTR 


让 我 们 从 简单 的 开始 : 找 零钱 。 这 个 任务 是 要 将 一 定 的 钱 数 用 一 些 硬币 来 表达 ， 这 些 硬 
币 可 能 具有 的 价值 是 通过 一 个 表 来 给 定 的 。 自 然 地 ， 我 们 希望 所 找 的 零钱 使 用 尽 可 能 大 的 硬 
币 。 如 果 硬 币 的 价值 是 按 降序 给 出 的 话 ， 这 就 很 容易 : 


fun change (coinvals, 0) = [] 
| change (c::coinvals, amount) = 
if amount<c then change (coinvals, amount) 
else c :: change(c::coinvals, amount-c) ; 
> **4Warning: Patterns not exhaustive 
> val change = fn : int list * int -> int list 


这 个 定义 几乎 是 最 直接 的 了 。 如 果 且 标 钱 数 是 零 ， 则 不 需要 硬币 ; 如 果 最 大 的 硬币 c 太 大 ， 则 


WHE; 否则 就 使 用 这 个 硬币 ， 并 将 钱 数 减 去 c 后 继续 找 零钱 。 
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w 
$} 


让 我 们 声明 两 个 表 来 表达 英美 两 国 的 硬币 价值 : 
val gbcoins = [50,20,10,5,2,1] 
and uscoins = [(25,10,5,1]; 
这 样 一 来 ，43 便 士 和 43 美 分 的 表达 方式 就 不 同 了 : 
change (gb.coins, 43); 
> [20, 20, 2, 1] : int list 
change (uscoins, 43); 
> [25, 10, 5, 1, 1, 1] : int list 


不 过 找 零钱 并 没有 一 开始 看 上 去 那么 简单 。 假 如 我 们 只 有 价值 为 5 和 2 的 硬币 ， 那 怎么 办 呢 ? 


change( [5,2], 16); 
> Exception: Match 


编译 器 在 我 们 声明 change 的 时 候 已 经 警告 过 有 这 种 可 能 性 了 。 但 是 16 是 很 容易 用 5 和 2 的 组 合 
来 表示 的 ! 我 们 的 算法 是 仿 禁 式 的 : 它 总 是 首选 价值 最 大 的 硬币 ， 试 图 将 16 表 达成 3+5+5+ 
c， 这 样 只 剩 下 c = 1 这 样 一 种 不 可 能 的 情形 了 。 

能 不 能 设计 个 好 一 点 的 算法 呢 ? «| (backtracking) 的 意思 是 当 错 误 发 生 时 倒退 最 近 的 
一 步 ， 并 重新 另 试 。 一 种 实现 回溯 的 方法 是 利用 异常 ， 这 会 在 4.8 节 中 讲 到 。 另 一 种 方法 是 计 
算出 所 有 可 能 答案 的 表 。 观 察 下 面 是 怎样 使 用 coins 来 存放 到 目前 为 止 所 选取 的 硬币 的 。 

fun allChange (coins, coinvals, 0) 

| allChange (coins, [], amount) 
| allChange (coins, c::coinvals, amount) 
if amount<0 then [] 
else allChange(c::coins, c::coinvals, amount-c) @ 
allChange (coins, coinvals, amount) ; 

> val allChange = fn 

> : int list * int list * int -> int list list 
HBAJ “patterns not exhaustive” 的 警告 不 见 了 ; 说 明 函 数 考 虚 了 所 有 的 情况 。 如 果 给 定 一 个 无 
解 的 问题 ， 函 数 则 会 返回 一 个 空 表 ， 而 不 是 抛 出 异常 : 

allChange({], [10,2], 27); 

> {] : int list list 


我 们 来 试 几 个 更 有 意思 的 例子 : 


allChange({], [5,2], 16); 

> [[2, 2, 2, 5, 5], [2, 2, 2, 2, 2, 2, 2, 2]] 

> : int list list 

allChange({], gb-coins, 16); 

> [[1, 5, 10], [2, 2, 2, 10], [1, 1, 2, 2, 10], ...] 
> ; int list list 


一 共有 25 种 办 法 来 找 16 便 士 的 零钱 ! 竺 一 看 ， 这 种 办 法 是 站 不 住 脚 的 。 为 了 控制 指数 般 增长 
的 解 的 数目 ， 可 以 使 用 惰性 求 值 ， 只 产生 必要 的 解 《 见 5.14 节 )。 


G) 进一步 的 阅读 。 一 般 来 讲 ， 找 零钱 问题 要 上 比 显 见 的 困难 得 多 。 它 与 子 集 和 
(subset-sum) 问题 关系 密切 ， 这 是 个 NP 完 全 问题 。 这 表示 了 很 可 能 找 不 到 一 个 有 效 
的 算法 来 确定 一 个 钱 数 能 否 用 一 套 给 定 的 硬币 来 表达 。Cormen 等 (1990) 讨论 了 求 
得 近似 解 的 算法 。 


[coins] 


[] 
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练习 3.11 书写 一 个 函数 来 将 整数 转化 成 罗马 数字 表示 。 输 入 合适 的 参数 ， 你 的 函数 应 该 可 
以 将 1984 表 达成 MDCCCCLXXXIII 或 者 MCMLXXXIV 。 


练习 3.12 ” 找 零钱 函数 期 望 coinvals 包 含 严格 递 碱 的 正 整 数值 。 如 果 这 个 前 提 条 件 不 满足 将 会 
怎样 ? 


练习 3.13 ”我 们 很 少 会 幸运 得 有 无 限 的 硬币 可 用 。 修 改 al1Change 来 从 一 个 有 限 的 钱包 中 找 
零钱 。 

练习 3.14 ”修改 allChange， 使 用 额外 的 参数 来 积累 它 的 解 ， 从 而 省 掉 那个 追加 操作 。 通 过 找 
99 便 士 的 零钱 来 比较 一 下 它 和 原来 版 本 的 效率 。 


3.8 二 进 制 算 术 


函数 式 程 序 设计 可 能 看 上 去 远离 硬件 ， 不 过 表 可 以 很 好 地 仿真 数字 电路 。 下 面 定 义 了 元 
素 为 0 和 1 的 表 的 加 法 和 乘法 。 
加 法 。 如 果 你 忘却 了 二 进 制 加 法 的 规则 ， 请 看 看 下 面 二 进 制 版 本 的 11 + 30 = 41: 


11110 
+ 1011 
101001 
加 法 从 右 到 左 进行 。 两 个 位 再 加 上 《从 右边 的 ) 任何 进位 得 出 一 个 该 位 置 的 和 位 和 一 个 向 
左 的 进位 。 从 右 到 左 对 于 表 来 说 方向 就 不 对 了 ， 表 头 元 素 在 最 左边 。 所 以 二 进 制 位 将 按 逆 
序 存储 。 
两 个 二 进 制 数 的 长 度 可 能 有 所 不 同 。 如 果 其 中 一 个 二 进 制 位 表 结 束 了 ， 那 么 它 留 下 的 进 
位 就 要 传递 给 男 一 个 表 剩 下 的 那些 位 。 
fun bincarry (0, ps) = ps 
| bincarry (1, []) = [1] 
| bincarry (1, p::ps) = (1-p) :: bincarry(p, ps); 
> ***Warning: Patterns not exhaustive 
> val bincarry = fn : int * int list -> int list 
没 错 ， 模 式 可 以 包含 常量 : BH. CK. AHRENS. ARbincarry Al LA few OK! , 
也 只 可 能 是 这 两 个 进位 值 。 对 于 其 他 的 进位 值 ， 函 数 是 无 定义 的 。 
二 进 制 和 是 定义 在 两 个 位 表 和 一 个 进位 上 的 。 当 其 中 一 个 位 表 结 束 时 ， 就 用 bincarry 去 处 
理 另 外 那个 。 如 果 有 两 个 位 需要 相 加 ， 那 么 就 计算 它们 的 和 及 其 进位 : 
fun binsum (c, [], qs) = bincarry (c,qs) 
| binsum (c, ps, 1)) = bincarry (c,ps) 
| binsum (c, p::ps, q::qs) = 


((c+pt+q) mod 2) :: binsum((c+p+q) div 2, ps, 4s); 
> val binsum = fn 


> : int * int list * int list -> int list 
让 我 们 试 试 11 + 30 = 41， 记 住 二 进 制 位 是 按 逆序 排列 的 : 


binsum (0, [1,1,0,1], [0,1,1,1,1]); 
> [1, 0, 0, 1, 0, 1] : int list 


来 法 。 二 进 制 乘法 是 通过 移 位 和 加 法 完成 的 。 例 如 ，11 x 30 = 330: 
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11110 


x 1011 
11110 
11110 
+ 11110 
101001010 


可 以 通过 插入 一 个 0 来 完成 移 位 : 


fun pirprod ([]，_) 
| binprod (0::ps, qs) 
| binprod (1::ps, qs) 


[] 
0: :binprod (ps, qs) 
binsum (0, qs, O::binprod(ps,qs)); 


> ***Warning: Patterns not exhaustive 
> val binprod = fn : int list * int list -> int list 


我 们 来 计算 11 x 30 = 330: 


binprod({1,1,0,1], [0,1,1,1,1]); 


> [0, 


1, 0, 1, 0, O, 1, O, 1) : int list 


二 进 制 算术 的 结构 。 在 大 的 程序 中 ， 通 过 命名 规则 ,例如 前 组 bin， 来 将 相关 的 函数 联系 
起 来 的 方式 并 不 怎么 样 。 二 进 制 算 术 的 函数 应 该 组 合 在 一 起 形成 一 个 结构 ， 比 如 说 Bin。 在 结 
构 里 面 可 以 使 用 短 一 些 的 名 字 ， 使 得 代码 更 为 易 读 。 从 外 部 看 ， 结 构 的 组 件 拥有 统一 的 复合 
名 字 。 上 面 的 函数 声明 可 以 很 容易 地 封装 成 一 个 结构 : 


structure Bin = 
struct 


fun carry (0, ps) 
fun sum (c, {], qs) 
fun prod ([], _) 


end; 


wow ft 


再 花 一 点 力气 的 话 ， 结 构 Bin 就 可 以 做 成 满足 2.22 节 的 签名 4RITH。 这 将 使 得 二 进 制 数 的 运算 
符 与 复数 的 运算 符 具 有 完全 相同 的 接口 。 如 此 一 来 ， 就 可 以 把 二 进 制 算术 收集 到 那些 可 以 用 
于 泛 型 算术 运算 包 的 算术 结构 中 去 了 。 但 是 ， 二 进 制 算 术 和 复数 算术 很 不 一 样 ， 例 如 ， 除 法 


不 是 精确 的 。 


练习 3.15 
术 函 数 。 

练习 3.16 
练习 3.17 
练习 3.18 


需要 注意 的 是 ， 我 们 有 责任 搞 清楚 在 某 一 种 特定 的 情况 下 都 需要 哪些 性 质 。 
书写 一 些 函 数 ， 通 过 布尔 量 的 表 来 完成 二 进 制 的 加 法 和 乘法 ， 不 能 使 用 内 置 的 算 


书写 一 个 函数 来 完成 两 个 二 进 制 数 的 除法 。 
利用 上 一 个 练习 的 结果 ， 或 者 书写 哑 邹 数 来 扩展 结构 Bin、 使 其 满足 签名 ARITH、 
十 进 制 数 可 以 用 0 到 9 组 成 的 整数 表 来 表示 。 书 写 一 些 函 数 来 完成 二 进 制 数 和 十 进 


file (4) 的 相互 转换 。 并 计算 100 的 阶乘 。 
3.9 SORE 
矩阵 可 以 看 成 是 由 行 组 成 的 表 ， 而 每 一 行 又 是 由 和 矩阵 的 一 行 元 素 组 成 的 表 。 秆 阵 


a b c 
(ae 
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可 以 在 ML 中 声明 成 : 
val matrix = [ ["a","b","c"], 
("d","e","£"] J; 
> val matrix = [["a", "b", "c"], ["d", "e", "E£"]] 
> : string list list 
使 用 这 种 表示 方法 ， 和 矩阵 的 转 置 可 以 做 得 很 好 ， 因 为 它 是 顺 着 行 和 列 完成 的 ， 中 间 没 有 跳跃 。 
转 置 函 数 将 行 组 成 的 表 


[x X25 > Xin), 
Ae: . 。 
ERT An2， an) Xam lI 
变换 成 列 组 成 的 表 : 
(lx, <7) Xl, 
at. Aa e” Xl, 
[Xim Xm J 


一 种 转 置 的 办 法 就 是 不 断 地 从 和 矩阵 里 面 提 取 列 。 每 行 的 头 一 个 元 素 合 在 一 起 组 成 了 和 矩阵 的 第 
一 列 : 


fun headcol [] ， G 

| headcol ((x::_) :: rows) x :: headcol rows; 
> ***Warning: Patterns not exhaustive 
> val headcol = fn : ‘a list list -> ‘a list 


同样 ， 每 行 的 表 尾 合 在 一 起 组 成 了 矩阵 剩 下 的 那些 列 : 


fun tailcols [j 


Wott 


| tailcols ((_::xs) :: rows) xs :: tailcols rows; 
> ***Warning: Patterns not exhaustive 
> val tailcols = fn : ‘a list list -> ’a list list 


再 看 一 下 用 在 这 个 小 矩阵 上 的 效果 : 
headcol matrix; 
> ["a", "d"] : string list 
tailcols matrix; 
> [["b", "c"], ("e", "f"]] : string list list 


调用 headcol 和 tailcols 将 矩阵 砍 成 下 面 的 样子 : 
be 
: 


a 

( 

这 两 个 函数 导致 了 一 个 不 寻常 的 递归 : tailcols 以 n 个 表 组 成 的 表 作 为 参数 ， 返 回 n 个 短 一 点 的 
表 所 组 成 的 表 。 这 个 过 程 最 后 将 得 到 n 个 空 表 ， 并 在 此 时 结束 。 | 

fun transp ({]::rows) = [] 

| transp rows = headcol rows :: transp (tailcols rows) ; 


> val transp = fn : 'a list list -> ’a list list 
transp matrix; 


> [["a", "a"}, ["b", "e"], ["c", "£"]] : string list list 








(a d\ 
W 
cf 
O 更 加 精炼 的 方法 。 这 里 展示 的 很 多 程序 都 可 以 通过 使 用 高 阶 画 数 更 为 简练 地 表 


达 ， 例 如 map， 它 将 一 个 函数 应 用 到 表 中 的 每 一 个 元 素 上 。 我 们 稍 后 就 会 讨论 到 高 阶 
加 数 。 你 可 以 敬一 下 5.7 节 ， 那 里 重新 考虑 了 矩阵 的 转 置 。 


练习 3.19 headcol 和 tailcols 不 能 处 理 什么 样 的 输入 模式 ”如果 “和 矩阵 ”的 行 不 一 样 长 ，transp 
将 返回 什么 呢 ? 
练习 3.20 输入 一 个 空 表 ，transp 将 怎么 办 ? 请 解释 一 下 。 
练习 3.21 ”另外 写 一 个 转 置 国 数 ， 使 用 将 行 转 为 列 来 取代 将 列 转 为 行 的 方法 。 
3.10 ERE 
我 们 快速 地 复习 一 下 矩阵 乘法 。 两 个 向 量 的 点 积 (dot product) (或 称 为 内 积 ) 是 这 样 的 
(ai, GD © (bi, ..., b) = a; bi +t a, br 


如 果 A 是 m x 的 矩阵 ， 而 B 是 k x n 的 矩阵 ， 那 么 它们 的 积 (product) A x B 就 是 一 个 m x nF 
BE. AY, AX B 的 第 (i, 由 个 元 素 就 是 4 的 第 i 行 与 8 的 第 j 列 的 点 积 。 例 如 : 


/2 0) [2 0 4) 
3 -1| (1 0 2 la 1 6 
0 i*a -1 o) 7 4 -1 0 
1 1 5 -1 2 














上 面 的 元 素 (1, 1) 是 由 下 式 计算 出 来 的 
(2,0): (1,4)=2x1+0x4=2 


在 下 面 的 点 积 函 数 中 ， 两 个 向 量 必须 具有 相同 的 长 度 ; 当 有 些 情况 没有 被 涵盖 时 ，ML 就 会 打 
印 出 警告 信息 。 以 后 这 些 警告 信息 通常 都 会 被 略 去 。 
fun dotprod([], []) = 0.0 
| dotprod (x::xs,y::ys) = x*y + dotprod (xs,ys); 
> ***Warning: Patterns not exhaustive 
> val dotprod = fn : real list * real list -> real 


如 果 4 只 有 一 行 ， 那 么 4 x BH RATT. BRrowprodit# T —îT SMB. MB YA 
以 它 的 转 置 形式 给 出 : 也 就 是 由 列 组 成 的 表 ， 而 不 是 由 行 组 成 的 表 。 


fun rowprod (row, [}) [] 
| rowprod (row, col: :cols) 
dotprod (row, col) :: rowprod (row, cols) ; 

> val rowprod = fn l 


> : real list * real list list -> real list 
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结果 矩阵 A x 8 的 每 一 行 都 是 由 和 矩阵 A 中 相应 的 一 行 与 整个 矩阵 8 的 乘积 而 得 来 的 : 


fun rowlistprod([], cols} {] 
| rowlistprod (row: : rows, cols) 
rowprod (row, cols) :: rowlistprod (rows, cols) ; 
> val rowlistprod = fn 
> : real list list * real list list -> real list list 


Sa RESET A BRU MA transp K HE Fh EE BAY Fl BA A He: 


fun matprod (rowsA,rowsB) = rowlistprod(rowsA, transp rowsB) ; 
> val matprod = fn 


> : real list list * real list’ list -> real list list 


下 面 是 刚才 矩阵 例子 的 声明 ， 省 去 了 ML 的 回应 : 


val rowsA = [ [2.0, 0.0], 
{3.0, ~1.0], 
{0.0 1.0], 
{1.0, 1.0) ] 
and rowsB = [ [1.0, 0.0, 2.0], 
{4.0, 71.0, 0.0} J; 


这 是 它们 的 积 : 
matprod (rowsA , rowsB) ; 
> [(2.0, 0.0, 4.0], 
{~1.0, 1.0, 6.0], 
(4.0, ~1.0, 0.0], 
{5.0, ~1.0, 2.0]] : real list list 


练习 3.22 JEM MAREE THR AMEE; 就 是 说 


a b -a -b 
(e aE a 
书写 一 个 求 负 年 阵 的 函数 。 
练习 3.23 ” 维 数 相同 的 两 个 矩阵 可 以 通过 把 它们 的 相应 分 量 相 加 而 完成 矩阵 的 相 加 ; 就 是 说 
a+a' b+b' 
(° 让 + ( AD on ta) 
5 5 — 7 EA OY BB 
3.11 高 斯 消 元 法 


高 斯 消 元 法 是 一 个 经 典 的 矩阵 算法 ， 它 可 能 看 上 去 并 不 适合 国 数 式 程序 设计 。 这 个 算法 
(Sedgewick, 1988) 可 以 计算 矩阵 的 行列 式 或 逆 矩 阵 ， 也 可 以 解 像 下 面 这 样 的 线性 无 关 的 线 
性 联 立 方程 组 : 


vvv” 


x+2y+7z=7 
—4w +3y— 5z = -2 (*) 
4w - x -2y -3z=9 
~2w+x+2y+8z=2 
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高 斯 消 元 法 依次 单独 处 理 每 一 个 未 知 数 。 方 程 (*) 经 过 适当 地 缩放 ， 然 后 加 到 另 一 个 方程 上 去 ， 
就 可 以 把 未 知 数 w 从 那个 方程 中 消去 。 重 复 这 个 被 称 为 主 元 消去 (pivoting) 的 操作 ， 最 后 联 
立方 程 组 就 被 简化 成 了 三 角形 : 
-4w +3y— 5z= -2 
x+2y+7z=7 
3y-z=14 
3z=3 
现在 解 就 出 来 了 ， 从 z = 1 开始 。 
通过 消去 w 来 解 方程 (9) 是 一 个 好 的 选择 ， 因 为 其 系数 的 绝对 值 (4) 是 最 大 的 。 缩 放 要 将 
方程 除 以 这 个 值 ; 而 一 个 小 的 除数 (更 不 用 说 零 ! ) 也 可 能 会 导致 数值 误差 。 函 数 pivotrow 从 
一 个 由 行 组 成 的 表 中 返回 行 首 元 素 绝对 值 最 大 的 一 行 。 
fun pivotrow [row] = row : real list 
| pivotrow (rowl: :row2: :rows) = 
if abs(hd rowl) >= abs (hd row2) 
then pivotrow (rowl: : rows) 
else pivotrow (row2: : rows) ; 
> val pivotrow = fn : real list list -> real list 


如 果 被 选择 的 行 有 首 元 素 p， 那 么 delrow(p, rows) 会 将 这 行 从 行 表 中 删 去 。。 


fun delrow (p, [}) 
| delrow (p, row: :rows) 


[] 
iff Real.==(p,hdhow) then rows 


else row :: delrow(p, rows); 
> val delrow = fn : ‘’a * ‘’a list list -> ’’a list list 
Agtscalarprod (数量 积 ) 将 一 行 或 者 说 一 个 向 量 乘 以 一 个 常数 此 
fun scalarprod(k, [1) = [] : real list 
| scalarprod(k, x::xs) = k*x :: scalarprod(k,xs) ; 


> val scalarprod = fn : real * real list -> real list 


函数 vectorsum 将 两 行 或 两 个 向 量 相 加 : 


fun vectorsum ({], (]) {] : real list 


| vectorsum (x::x8,y::ysS) = x+y :: vectorsum(xs,ys); 
> val vectorsum = fn : real list * real list -> real list 
在 gausselim 内 部 声明 的 函数 elimcol 通 过 行 首 p (第 一 个 系数 ) 和 行 尾 prow 来 引用 主 元 行 。 给 定 
一 个 行 表 ，elimcol 将 其 中 的 每 一 行 加 上 恰当 缩放 后 的 prow。 每 行 相 加 后 的 第 一 个 元 素 是 零 ， 
但 是 这 些 零 是 不 用 计算 的 ; 第 一 列 只 是 简单 地 消失 了 。 
fun gausselim [row] = [row] 
| gausselim rows = 


I H 


let val p::prow = pivotrow rows 
fun elimcol [] = Í] 


O ”注意 此 处 的 类 型 变量 "， 它 要 求 类 型 是 相等 类 型 ( 稍 后 会 介绍 )。 最 新 的 Standard ML 基本 库 把 实数 从 相等 
类 型 中 除去 了 (可 能 是 出 于 实数 不 能 精确 表示 的 考虑 )， 使 得 等 号 不 能 用 于 实数 的 比较 。 不 过 基本 库 的 Real 
结构 中 提供 了 实数 专用 的 比较 函数 (== 和 != 等 )。 因 此 还 是 可 以 定义 delrow 的 ， 不 过 这 样 定义 的 函数 就 不 
再 是 多 态 的 了 。 一 一 译 者 注 
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| elimcol ((x::xs)::rows) = 
vectorsum (xs, scalarprod(~x/p, prow)) 
: elimcol rows 


(* 这 里 的 rows 是 在 elimcol 定 义 的 作用 域 中 ， 
lE] 7 Łkjgausselimýjrows *) 


in (p::prow) +: gausselim(elimcol(delrow(p, rows) )) 
end; 


> val gausselim = fn : real list list -> real list list 


函数 gausselim 将 主 元 行 移 走 ， 消 去 一 列 ， 并 递归 地 调用 自己 来 处 理 简 化 后 的 矩阵 。 它 将 返回 
由 一 系列 主 元 行 组 成 的 表 ， 每 行 的 长 度 递减 ， 形 成 了 一 个 上 三 角 和 矩阵 。 

n 元 联 立方 程 组 可 以 通过 在 n x (n + 1) 和 矩阵 上 使 用 高 斯 消 元 法 来 求解 ， 多 出 的 一 列 是 方程 
组 的 右 式 。 解 可 以 递归 地 从 三 角 和 矩阵 中 得 出 。 已 经 得 出 的 那些 解 需 要 乘 上 它们 的 系数 并 加 起 
来 ， 这 是 两 个 向 量 的 点 积 运算 ， 然 后 除 以 该 行 首 未 知 数 的 系数 。 我 们 不 要 忘 了 方程 的 右边 ， 
为 了 减 去 这 个 值 ， 我 们 使 用 一 个 窍门 : 假 造 一 个 解 -1， 并 从 它 开 始 。 

fun solutions [] 

| solutions ( (x: :xs) : : rows) 
let val solns = solutions rows 
in ~ (dotprod (solns,xs)/x) :: solns end; 

> val solutions = fn : real list list -> real list 
一 种 理解 这 个 定义 的 方法 就 是 拿 它 试 试 上 面 的 方程 例子 。 我 们 先 来 计算 三 角 和 矩阵 : 

gausselim [[ 0.0, 1.0, 2.0, 7.0, 7.0], 


[71.0] 


[74.0 0.0, 3.0, 75.0, 72.0], 
[ 4.0, 71.0, 72.0, 73.0, 9.0], 
[72.0 1.0, 2.0, 8.0, 2.0)]; 

> [[~4.0, 0.0, 3.0, ~5.0, ~2.0], 

> [{ 1.0, 2.0 7.0, 7.0] 

> {[ 3.0, “1.0, 14.0] 

> [3.0 3.0]] : real list list 


忽略 掉 末 尾 假 造 的 -1， 方 程 的 解 是 w = 3,x= -10,y=5 和 z= 1。 
solutions it; 
> [3.0, 710.0, 5.0, 1.0, ~1.0] : real list% 


Ol 进一步 的 阅读 。 威 尔 十 大 学 的 研究 员 们 曾 将 Haskell 语 言 应 用 于 解决 计算 流体 动 
力学 的 问题 。 目 的 是 为 了 考察 一 下 函数 式 程序 设计 的 实际 用 途 。 其 中 一 篇 文章 比较 
了 矩阵 的 各 种 表达 方式 (Grant 等 ，1996 )。 另 一 篇 考虑 了 使 用 并 行 的 可 能 性 ， 通 过 
一 个 仿真 的 并 行 处 理 器 (Grant 等 ，1995)。 同 传统 的 Fortran 实 现 相 比 ，Haskell 的 实 
现 非常 慢 ， 而 且 需 要 更 多 的 空间 ;作者 们 列举 了 一 些 可 能 增加 效率 的 开发 成 果 。 
练习 3.24 证 明 如 果 输 入 的 方程 组 是 线性 无 关 的 ， 那 么 除 以 零 的 情况 在 gausselim 里 是 不 可 能 
发 生 的 。 
练习 3.25 ”如 果 多 行 的 行 首 元 素 绝对 值 都 相同 的 话 ，pivotrow 和 delrow 能 正确 工作 吗 ? 
练习 3.26 书写 一 个 函数 来 计算 和 矩阵 的 行列 式 。 
练习 3.27 ”书写 一 个 函数 来 求 疗 矩阵。 





70 BIE 


练习 3.28 书写 一 个 满足 签名 ARITH 的 结构 Matrix。 你 可 以 使 用 上 一 个 练习 以 及 3.10 节 的 结果 , 
或 者 书写 哑 函 数 。 这 样 矩 阵 也 成 了 我 们 的 一 个 算术 结构 了 。。 


3.12 分 解 一 个 数 为 两 个 平方 数 之 和 


Dijkstra (1976) 介绍 了 一 个 程序 ， 已 知 一 个 整数 r， 找 到 所 有 的 满足 方程 + y = r 的 整 
数 解 。( 假设 zx> y>>0， 以 避免 对 称 的 解 .) 例如 ，25 = 47 + 3° = 5? +07, 而 48 612 265 则 有 32 
个 解 。 

穷尽 地 搜索 所 有 的 (x, 7) 序 偶 对 于 大 数 来 说 并 不 现实 ， 但 所 幸 地 是 解 有 着 某 种 规律 : BX? + 
yersw+vBx>u, Way <v。 如 果 x 从 Vr 开始 向 下 搜寻 ， 同 时 y 从 0 开始 向 上 搜寻 ， 那 
么 在 一 遍 扫描 中 就 可 以 发 现 所 有 的 解 。 

设 Bei(x,y) 代 表 所 有 的 在 x 和 y 之 间 的 解 : 

Bet(x, y)={(u,v)|W+vW=rAxrurv>y} 
根据 下 面 的 四 条 分 析 结 果 搜 索 合适 的 x 和 y: 

1. #4 y’<r, WilBet(x, y) = Bet(x,y + 1)。 当 w< x 时， 肯定 不 存在 形 如 (4,y) 的 解 。 

2.4 +y =r, WMBet(x, y) = ((x, y)} UBet(x--1,y+1)。 就 这 一 个 解 ! 对 于 同样 的 x 或 y 来 说 
不 会 有 其 他 的 解 了 。 

3. xe + yror>x4+(y-1), WMlBet(x, y) = Bet(x-1,y)。 不 可 能 有 形 如 (x,v) 的 解 了 。 

4. 最 后 ， 当 x < ykf, Betlx, y) = Ø. 

这 些 提 供 了 一 个 递归 的 ， 实 际 上 是 迭代 的 ， 搜 索 方 法 。 对 于 第 3 种 情况 ， 如 果 想 高 效 使 用 的 话 
则 需要 特别 小 心 。 一 开始 ， 要 保证 ?+ <r. EMMI, AEL +y >r MR + y > 
r， 那 么 y 必 定 是 满足 这 个 不 等 式 最 小 的 值 ， 这 就 可 以 应 用 第 3 种 情况 了 。 将 x 减 1 就 重新 建立 了 
v+y<r, 

一 开始 y = 0 且 x=Vr (7 的 整数 平方 根 )， 因 此 开始 条 件 是 满足 的 。 由 于 x > y， 我 们 知道 
在 轮 到 减 x 之 前 ，y 需 要 递增 几 次 。 因 此 ， 为 了 进一步 提高 效率 ， 程 序 在 内 层 递归 之 外 计算 x: 

fun squares r = 

let fun between (x,y) = (* x 和 ?之 间 的 所 有 序 偶 *) 
let val diff = r - x*x 
fun above y = (* 大 于 或 等 于 ?的 所 有 序 偶 *) 
if y>x then [] 
else if y*y<diff then above (y+1) 
else if y*y=diff then (x,y) : :between(x-1,y+1) 
else (* y*y>diff *) between(x-1,y) 
in above y end; 
val firstx = floor (Math. sqrt (real r)) 
in‘ between (firstx, 0) end; 

> val squares = fn : int -> (int*inft) list 

执行 速度 很 快 ， 即 使 r 是 很 大 的 数 : 


squares 50; 
> [(7, 1), (5, 5)] : (int*int) list 
squares 1105; 


O 这 是 一 个 困难 的 问题 : 组件 zero 是 什么 ?一 个 显然 的 选择 就 是 []， 但 是 矩阵 的 操作 都 需要 小 心 修改 ， 以 便 正 
确 地 将 其 处 理 作 零 矩阵 。 
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> £(33, 4), (32, 9), (31, 12), (24, 23)] : (int*int) list 
Squares 48612265; 


> [(6972, 59), (6971, 132), (6952, 531), (6948, 581), 

> (6944, 627), (6917, 876), (6899, 1008), (6853, 1284), 

> (6789, 1588), (6772, 1659), ...] : (int*int) list 
Dijkstra 的 程序 使 用 了 另外 一 种 搜索 方法 : x 和 y 从 相等 的 值 开始 分 别 向 两 头 扫 描 。 我 们 在 这 
里 所 用 的 推导 方法 很 可 能 是 他 不 想 要 的 ， 因 为 “ 想 说 明 没有 漏 掉 任何 一 个 解 ， 少 不 了 要 夯 
张 图 吧 。”9 


O 更 聪明 的 方法 ? 一 个 数 可 以 恰 为 两 个 数 的 平方 和 ， 仅 当 它 的 质 因数 分 解 里 ， 所 
有 的 形 如 4k + 3 的 因子 的 指数 都 是 偶数 。 例 如 ，48 612 265 = 5x13x17x29x37x 
41， 这 些 质数 没有 一 个 是 形 如 4 + 3 的 。 条 件 本 身 主 要 告诉 我 们 解 是 否 存在 ， 不 过 这 
个 理论 也 提供 了 一 种 枚 举 解 的 方法 (Davenport，1952， 第 V 章 )。 只 有 计算 很 大 的 数 
时 ， 利 用 这 一 理论 的 程序 才 是 值得 的 。 


3.13 求 后 继 排列 的 问题 


已 知 一 列 整 数 ， 要 将 它们 重新 排列 形成 按 字典 顺序 的 后 继 排列 。 新 的 排列 要 比 原来 的 大 ， 
并 且 没 有 其 他 排列 夹 在 两 者 之 间 。 | 

我 们 对 这 个 问题 做 一 点 修改 。 字 典 顺 序 的 意思 是 表 头 元 素 是 最 高 位 ， 而 后 继 的 排列 很 可 能 
只 在 最 低位 元 素 上 有 所 区 别 。 由 于 表 头 元 素 最 容易 访问 ， 因 此 将 表 头 元 素 作为 最 低位 ， 我 们 也 
没有 必要 在 是 否 依 表 的 自然 顺序 这 个 问题 上 争论 。 这 样 ， 就 按 逆 字典 顺序 来 计算 后 继 排 列 。 

这 个 问题 很 难 形象 地 描述 ， 即 使 是 Dijkstra 也 需要 举 个 例子 。 下 面 是 4 3 2 1 (最 初 的 排列 ) 
之 后 的 8 个 排列 : 





每 一 个 排列 中 受 影响 的 部 分 都 由 下 划 线 标 出 。 排 列 的 序列 在 1 2 3 4 处 终止 ， 它 没有 后 继 。 

要 求 得 更 大 的 排列 ， 表 中 的 某 些 元 素 必 定 要 被 它 左 侧 的 一 个 更 大 的 元 素 所 替换 。 要 求 得 
恰好 下 一 个 排列 ， 这 个 被 替换 的 元 素 必 须 尽 量 靠 左 ， 也 就 是 尽量 靠 低位 。 用 来 替换 的 元 素 也 
必须 要 尽量 小 ， 并 且 被 替换 的 元 素 的 左 侧 也 要 重新 从 左 到 右 按 降 序 排列 。 所 有 这 些 可 以 通过 
下 面 两 步 完 成 : 

(1) 找到 最 左边 的 一 个 元 素 y， 使 得 其 左 侧 存在 比 它 大 的 元 素 。 显 然 ， 这 个 元 素 的 左 侧 的 

O ”这 是 作者 的 幽默 。 我 不 知道 Dijkstra 有 没有 说 过 这 句 话 ， 这 位 大 师 已 于 2002 年 去 世 了 。 作 为 令 人 敬仰 的 学 者 ， 


他 为 计算 机 科学 作出 了 丰富 而 深刻 的 贡献 ， 同 时 也 留 下 了 个 人 严谨 而 有 时 近乎 怪 癣 的 观点 和 风格 。 一 一 译 
者 注 
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那些 元 素 是 按 升序 排列 的 序列 x, <… < x,。( 这 里 我 们 实际 是 用 元 素 的 位 置 来 描述 元 素 ， 不 过 
这 只 在 元 素 彼 此 不 同 的 时 候 才 是 可 以 的 。) 

(2) 将 ?替换 成 最 小 的 上 ， 满 足 l<i<n 且 ?< 和 ， 并 将 序列 rz .…, xb Y Xa o Xo 重 新 按 降序 
排列 。 要 完成 这 个 任务 ， 可 以 扫描 序列 %, X …, xX; 直到 发 现 正确 的 x;,， 并 将 较 大 的 值 放 在 结 
果 的 前 面 。 
调用 函数 next(xlist, ys) 可 以 在 ys 里 面 找 到 需要 替换 的 y， 同 时 xlist 累 积 了 那些 被 略 过 的 元 素 。 当 
xlist 存 放 了 那个 逆向 的 序列 [x,, .…, Xi 后， 函数 swap 就 完成 了 替换 和 重新 按 降 序 排列 的 任务 。 
这 里 ， 表 的 操作 是 很 精致 的 。 


fun next(xlist, y::ys) : int list = 
if hd xlist <= y then next(y: :xlist, vs) 
else (* 将 ?和 满足 xz>= xk > ?的 最 大 的 克 交 换 *) 
let fun swap [x] = y::X: :ys 
| swap (x: :Xk: :xs) = (*x >= xk*) 
if xk>y then x: : swap (xk: :xs) 
else (y::xk: :x5)@ (x: :ys) 
(*x > y >= xk >= xs*) 
in swap (xlist) end; 
> val next = fn : int list * int list -> int list 


国 数 mextperm 启 动 这 个 扫描 。 


fun nextperm (y::ys) = next([y], ys); 

> val nextperm = fn : int list -> int list 
nextperm [1,2,4,3]; 

> (3, 2, 1, 4] : int list 

nextperm it; 

> [2, 3, 1, 4] : int list 

nextperm it; 

> [3, 1, 2, 4] : int list 


这 对 于 有 相同 元 素 的 表 也 适用 : 


nextperm [3,2,2,1]; 

> [2, 3, 2, 1] : int list 
nextperm it; 

> [2, 2, 3, 1] : int list 
nextperm it; 

> [3, 2, 1, 2] : int list 


练习 3.29 Bitnextperm(2,3,1,4] Withee. 


练习 3.30 ”如 果 next 函 数 第 二 行 的 < 换 成 了 <， 那 么 这 个 函数 还 对 吗 ? 根据 上 面 所 讨论 的 那 两 
NF RR HER 


练习 3.31 ”如 果 ys* 没 有 后 继 排列 ， 那 么 nextperm(ys) 返 回 什 么 ? 修改 程序 使 得 它 在 这 种 情况 下 
返回 初始 排列 (字典 顺序 中 最 小 的 排列 )。 


多 态 函 数 中 的 相等 测试 
像 length 和 rev 那 样 的 多 态 函 数 可 以 接受 具有 任何 类 型 元 素 的 表 ， 因 为 它们 对 表 中 的 元 素 


[06] 并 不 进行 任何 操作 。 现 在 来 看 一 个 函数 ， 它 测试 一 个 值 e 是 否 存 在 于 一 个 表 ! 中 ， 这 个 函数 是 多 
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态 的 吗 ? 每 个 ! 中 的 元 素 都 要 和 e 进 行 相等 测试 。 相 等 测试 是 多 态 的 ， 不 过 有 一 定 的 限制 。 
3.14 相等 类 型 


相等 类 型 (equality type) 是 一 种 其 值 允 许 相 等 测试 的 类 型 。 相 等 测试 对 于 函数 类 型 和 抽 
象 类 型 都 是 行 不 通 的 : 

。 对 于 两 个 函数 的 相等 测试 是 不 可 计算 的 ， 因 为 f 和 8 是 相等 的 仅 当 对 于 每 一 个 可 能 的 x， 

flx) 等 于 g(x)。 也 有 其 他 的 方法 来 定义 函数 的 相等 ， 但 都 逃 不 过 这 个 问题 。 

。 抽 象 类 型 只 提供 在 其 定义 中 所 指定 的 操作 。ML 隐 藏 了 具体 的 类 型 表达 实体 的 相等 测试 ， 

因为 它 往往 和 所 期 望 的 抽象 意义 上 的 相等 并 不 一 致 。® 
相等 对 于 许多 基本 类 型 是 有 定义 的 : 整数、 实数、 字符、 字符 串 和 布尔 类 型 。 对 于 结构 类 型 
的 值 ， 相 等 测试 比较 它们 的 相应 分 量 ， 这 样 一 来 ， 相 等 测试 对 于 由 基本 类 型 组 成 的 元 组 、 记 
录 、 表 和 数据 类 型 (datatype， 将 在 下 一 章 介绍 ) 都 有 定义 。 而 在 那些 包含 函数 或 抽象 类 型 元 
素 的 值 上 并 没有 定义 相等 测试 。 

Standard ML 提供 了 相等 类 型 变量 (equality type variable) or、 订 、 太 、…， 它 们 在 相等 
类 型 的 范围 内 变化 。( 多 态 的 ) 相等 类 型 不 包括 相等 类 型 变量 以 外 的 类 型 变量 。 例 如 ，int、 
bool x string 和 (int list) x 都 是 相等 类 型 ， 而 int > bool 和 bool x B 则 不 是 。 

下 面 是 相等 测试 中 缀 操作 符 (=) 本 身 的 类 型 : 

OP= ; 

> fn : (’'a * ‘a) -> bool 
这 个 类 型 的 数学 记 法 是 or x or ~ boot。 在 ML 中 ，- 个 相等 类 型 变量 的 名 字 由 两 个 撤 号 〈()) F 
符 开 始 。 

我 们 来 声明 一 下 成 员 测试 函数 : 

fun (t mem {]) = false 


| (x mem (y::1)) (x=y) orelse (x mem l); 
> val mem = fn : ‘’a * ‘’a list -> bool 


类 型 oF x (o 060 一 pool 表 示 了 mem 可 以 应 用 到 所 有 元 素 类 型 为 相等 类 型 的 表 上 去 。 
"Sally" mem [{"Regan","Goneril","Cordelia"]; 


> false : bool 


3.15 多 态 集合 操作 

如 果 一 个 国 数 进 行 了 多 态 的 相等 测试 ， 即 使 是 间接 的 ， 例 如 通过 函数 me 严 ， 那 么 这 个 函 
数 的 类 型 里 面 就 包含 有 相等 类 型 变量 。 函 数 rxewmem 可 以 往 一 个 表 里 面 添 加 一 个 新 元 素 ， 并 保 
证 确实 是 新 的 (原来 没有 的 )。 


fun newmem(x,xs) = if x mem xs then xs else XxX: :Xs5; 
> val newmem = fn : ’’a * ‘‘’a list -> '’a list 


通过 newmem 构 造 的 表 可 以 被 看 作 是 有 限 集合 。。 让 我 们 来 声明 一 些 集合 的 操作 ， 并 注意 一 下 


日 第 7 章 详细 介绍 了 抽象 类 型 。 
日 ”后 面 的 3.22 节 更 深入 地 讨论 了 用 一 种 数据 结构 来 表示 另 -- 种 数据 结构 的 问题 。 
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它们 的 类 型 。 如 果 出 现 了 相等 类 型 变量 ， 那 么 就 说 明 涉及 了 相等 测试。 
函数 setof 通 过 删 去 重复 元 素来 将 一 个 表 转 换 为 “集合 ” 


fun setof [] = [] 
| setof (x::xs) = newmem(x, setof xs); 

> val setof = fn : ‘’a list -> ‘’a list 

setof [true , false, false, true , false] ; 

> [true, false] : bool list 
看 得 出 setof 可 能 会 进行 非常 多 的 相等 测试 。 为 了 减少 setof 的 使 用 ， 下 面 的 函数 可 以 被 应 用 到 
没有 重复 元 素 的 表 所 表示 的 所 谓 “ 和 集合” 上 ， 并 保证 它们 的 结果 也 是 一 个 “集合 ”。 

并 集 。union(xs, ys) 返 回 的 表 加 进 了 所 有 xs 中 没有 出 现在 ys 中 的 元 素 ， 假设 ys 已 经 是 一 个 
没有 重复 元 素 的 表 : 


mh 


fun union([],ys) = ys 
| union(x::xs, ys) = newmem(x, union(xs, ys)); 
> val union = fn: ‘’a list * ‘'’a list -> ‘’a list 


类 型 变量 "a 表明 使 用 了 相等 测试 ， 在 这 里 是 通过 newmem 进 行 的 。 
union({1,2,3], [0,2,4]); 
> [1, 3, 0, 2, 4] : int list 


交集 。 类 似 地 ，inter(xs, ys) 包 括 了 所 有 xs 和 ys 共有 的 元 素 : 
[] 


if x mem ys then x: :inter(xs, ys) 
else inter (xs, ys); 
> val inter = fn : ’’a list * ‘’a list -> ’’a list 


观 儿 的 名 字 可 以 在 父母 喜欢 的 名 字 的 交集 里 面 选择 


inter { {[ "John" , "James" , "Mark"], ["Nebuchadnezzar","Bede"]); 
> [] : string list 


ae 虽然 这 个 办 法 很 少 管用 。 
子 集 关 系 。 当 集合 7 的 所 有 元 素 都 是 集合 S 的 元 素 时 ，7 就 是 S 的 子 集 (subset): 


infix subs; 


fun inter((],ys) 
| inter (x::xs, ys) 


IO H 


fun ([] subs ys) = true 
| ((x::xs) subs ys) = (x mem ys) andalso (xs subs ys); 
> val subs = fn : ‘’a list * ''a list -> bool 
记得 相等 类 型 也 包括 元 组 、 表 等 : 
{("May",5), ("June",6)] subs [("July",7)]; 


> false : bool 


集合 的 相等 。 内 置 的 表 的 相等 测试 对 集合 是 无 效 的 。 表 [3, 4] 和 表 [4, 3] 是 不 等 的 ， 但 它们 
表示 了 同一 个 集合 。 集 合 的 相等 是 忽略 顺序 的 。 它 可 以 用 子 集 来 定义 : 


infix seq; 

fun (xs seq ys) = (xs subs ys) andalso (ys subs xs); 
> val seg = fn: ’’a list * ’’a list -> bool 
{3,1,3,5,3,4] seq {1,3,4,5]; 

> true : bool 
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集合 应 该 被 定义 成 抽象 类 型 ， 将 表 的 相等 测试 隐藏 起 来 。 
BK. RASHER (powerset) 是 所 有 5S 的 子 集 所 组 成 的 集合 ， 包 括 空 集合 和 5 本 身 。 它 
可 以 通过 计算 从 5 中 移 去 一 个 元 素 x 后 的 集合 5-{x} 的 嗜 集 来 递归 求 得 。 如 果 集 合 T 是 5-{x} 的 子 
集 ， 那 么 T 和 TU {x} 两 者 都 是 5 的 子 集 ， 也 就 是 5 守 集 的 元 素 。 参 数 base 积 累 那些 必须 包含 在 结 
果 窜 集 的 每 一 个 元 素 集 合 中 的 ， 像 x 那样 的 元 素 。 在 一 开始 ，base 必 须 为 空 。 


fun powset ([], base) = 
| powset (x: :xs, base) = 
powset (xs, base) @ powset (xs, x::base) ; 
> val powset = fn : ’a list * ‘a list -> ‘a list list 


这 里 ， 普 通 的 类 型 变量 表明 了 powset 并 没有 进行 相等 测试 。 


powset (rev ["the","weird","sisters"], []); 

> [[], ["the"], ["weird’], ["the", "weird"], ["sisters"], 
> ["the", "sisters"], ["weird", "sisters"], 

> ["the", "weird", "sisters"}] : string list list 


使 用 集合 的 记 法 ，powset 的 结果 可 以 像 下 面 那样 描述 ， 忽 略 掉 表 元 素 的 顺序 : 

powset(S, B)={TUBITCS} 
GERAR. BASHMRATH GFK RA (Cartesian product) 就 是 所 有 满足 x E SHy E 
7 的 序 偶 (x, y) 的 集合 。 用 集合 的 记 法 就 是 : 

SxT ={(x, y)lxES, yET} 
好 几 种 函数 式 语言 都 支持 一 些 集 合 记 法 ， 这 是 追随 了 David Turner， 范 例 详 见 Bird 和 Wadler 
(1988)。 由 于 ML 并 不 支持 ， 我 们 必须 在 表 上 使 用 递归 。 计 算 笛 卡尔 乘积 的 函数 出 平 意料 地 


复杂 。 
fun cartprod ([]， ys) 


| cartprod (x::xs, ys) 
let val xsprod 


[ base] 


{] 


en OO 


cartprod (xs, ys) 


fun pairx ] = xsprod 
| pairx(y::ytail) = (x,y) :: (pairx ytail) 
in pairx ys end; 
> val cartprod = fn : ‘a list * ‘b list -> (‘a * ‘b) list 


函数 cartprod 并 不 进行 相等 测试 。 


cartprod{ [2,5], ["moons","stars","planets"]); 

> [(2, "moons"), (2, "stars"), (2, "planets"), 
> (5, "moons"), (5, "stars"), (5, "planets")] 
> : (int * string) list 


5.10 节 会 展示 怎样 用 高 阶 函 数 来 表示 这 个 函数 。 目 前 ， 让 我 们 继续 使 用 简单 的 方法 。 
练习 3.32 在 计算 下 面 的 表达 式 时 ，ML 需 要 进行 多 少 次 相等 测试 ? 


1 mem upto(1,500) 
setof (upto(1,500)) 


练习 3.33 ”比较 函数 xnion 和 下 面 定义 的 jiunion。 哪 个 函数 效率 更 高 ? 
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fun itunion([{],ys) 
| itunion(x::xs, ys) 


ys 
itunion (xs, newmem (x, ys)); 


练习 3.34 ”书写 函数 choose、 使 得 choose(k, xs) 产 生 集合 xs 的 所 有 K 个 元 素 的 子 集 合 所 组 成 的 
集合 。 例 如 ，choose(29, upto(1, 30)) 应 该 返回 一 个 包括 30 个 子 集 合 的 表 。 


练习 3.35 下 面 的 函数 比 cartprod 要 简单 。 它 会 更 好 地 计算 尔 卡 儿 乘积 吗 ? 


fun cprod ([]， ys) = [] 
| cprod (x::xs, ys) = 
let fun pairx [] = cprod (xs, ys) 
| pairx(y::ytail) = (x,y) :: (pairx ytail) 
in pairx ys end; 
3.16 关联 表 


字典 或 表格 可 以 用 序 偶 的 表 来 表示 。 搜 索 这 种 表格 的 函数 涉及 到 相等 测试 。 要 存放 历史 
上 重大 战役 的 时 间 ， 我 们 可 以 这 样 写 
val battles = 


[("Crecy",1346), ("Poitiers",1356), ("Agincourt",1415), 
("Trafalgar",1805), ("Waterloo",1815)j; 


( 键 ， 值 ) 的 序 偶 表 叫 做 关联 表 (association list)。 函 数 assoc 通 过 顺序 搜索 来 查找 与 一 个 键 关 
联 的 值 : 


fun assoc ([), a) 


{] 


| assoc ((x,y)::pairs, a) = if a=x then [y] 


else assoc(pairs, a); 
> val assoc = fn: (''a * ’b) list * ‘‘’a -> ’b list 


它 的 类 型 (ocx Pjlist x or > B list， 说 明了 键 必须 具有 某 种 相等 类 型 c-， 而 值 则 可 以 使 任何 类 型 
PB。 调用 assoc(pairs, x) 返 回 0 则 说 明 键 x 没 有 找到 ， 如 果 找到 与 x 配对 的 y， 则 会 返回 [y]。 把 结 
果 作 为 表 来 返回 是 一 种 简单 的 区 分 成 功 和 失败 的 方法 。 

assoc (battles, “Agincourt"); 

> [1415] : int list 

assoc (battles, “Austerlitz"); 

> [] : int list 
搜索 可 能 会 很 慢 ， 但 是 更 新 却 很 快 ， 只 要 把 新 的 序 偶 放 到 前 面 就 行 了 。 由 于 assoc 返 回 它 所 发 
现 的 第 一 个 值 ， 所 以 旧 的 就 被 新 的 覆盖 了 。 在 块 式 结构 化 语言 中 将 名 字 和 它 的 类 型 关联 起 来 
就 是 关联 表 的 一 种 典型 应 用 。 如 果 一 个 名 字 在 嵌 套 的 多 个 块 中 都 有 声明 ， 那 么 这 个 名 字 可 能 
以 不 同类 型 多 次 出 现在 一 个 关联 表 中 。 


|) 相等 类 型 : 好 还 是 坏 ? Appel (1993) 基于 多 个 方面 对 ML 的 相等 多 态 性 进行 了 
批评 。 这 使 得 语言 的 定义 更 复杂 了 。 它 同时 也 使 实现 更 复杂 了 : 数据 必须 具有 运行 
时 的 标记 来 支持 相等 测试 ， 否 则 一 个 相等 测试 的 方法 就 要 隐 式 地 传 入 用 到 它 的 那些 
BREE, HH, RROMENKRAKESH, Wi AROHRORAMAT. $ 
态 的 相等 测试 也 会 很 慢 。 

使 用 相等 多 态 性 的 部 分 原因 是 历史 性 的 。ML 和 Lisp 很 有 关系 ， 在 Lisp 中 像 mrem 
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和 assoc 这 样 的 函数 都 作为 基本 原 语 。 但 是 ， 就 连 Lisp 也 必须 对 这 些 函 数 提供 不 同 的 
版 本 进行 不 同类 型 的 相等 测试 。 如 果 MEL 没 有 相等 多 态 性 ， 那 些 函 数 仍然 可 以 通过 传 
入 额外 的 测试 通 数 来 表达 。 

相等 实际 上 是 被 重 载 了 的 : 它 的 含义 取决 于 它 的 类 型 。 其 他 的 重 载 函 数 包 括 那 
些 算术 运算 以 及 将 值 表 示 为 字符 串 的 函数 。ML 对 重 载 的 处 理 看 来 很 不 令 人 满意 ， 特 
别 是 和 Haskell 典 雅 的 类 型 类 (type class) (Hudak 等 ，1992) 相 比 。 但 是 类 型 类 也 令 
语言 更 加 复杂 化 。 更 严重 的 是 ， 一 个 程序 在 没有 彻底 地 类 型 检查 之 前 根本 不 能 运行 ， 
哪怕 只 是 原则 上 的 。 ov (1995) 讨论 了 另 一 种 替代 的 设计 ; 这 方面 需要 更 多 
的 研究 。 


3.17 图 的 算法 
序 侦 表 也 可 以 用 来 表示 有 向 图 。 每 个 序 偶 (x, y) 代 表 一 条 x 一 y 的 边 。 这 样 ， 表 


val graphl = [("a" "), ("a","c"), ("a","a"), 
("b","e"), (" c" "f"), ("a","e"), 
(re","E£"), ("e","g")]); 
就 表示 了 图 3-1a 所 示 的 图 。 
一 
a) a@——— co 8 


Ne 
-一 人 一、 


6 一-- 人 4 a 3 — 5 


Se 


图 3-1 An PRE 
函数 nexts 从 图 中 找 出 结 点 a 的 所 有 后 继 ， 也 就 是 从 a 出 发 的 边 的 终点 : 


fun nexts (a, []) = [] 
| nexts (a, (x,y)::pairs) = ` 
if a=x then y :: nexts(a, pairs) 
else nexts (a, pairs) ; 
> val nexts = fn: ‘’a * (’’a * 'b) list -> ‘’b list 


这 个 函数 和 assoc 有 点 不 同 ， 它 返回 所 有 与 a 组 成 序 偶 的 值 ， 而 不 仅 是 第 一 个 值 : 

nexts("e", graphl); 

> ["f", "g"] : string list 

深度 优先 搜索 。 许 多 图 的 算法 都 是 顺 着 边 访问 结 点 ， 并 记 住 那些 访问 过 的 结 点 ， 这 样 每 
个 结 点 最 多 访问 一 次 。 在 深度 优先 搜索 (depth-first search) 中 ， 从 当前 结 点 可 以 到 达 的 子 图 


b) 
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将 首先 被 浏览 ， 然 后 才 轮 到 其 他 结 点 。 函 数 depthf 实 现 了 这 一 搜索 策略 ， 利 用 参数 visited 来 将 
访问 过 的 结 点 按 逆序 积累 起 来 : 
fun depthf ([], graph, visited) = rev visited 
| depthf (x::xs, graph, visited) = 
if x mem visited then depthf (xs, graph, visited) 


else depthf (nexts(x,graph) @ xs, graph, x: : visited) ; 
> val depthf = fn 


> : ‘fa list * (’’a * ’’a) list * ’’a list -> ’’a'‘list 
图 的 结 点 可 以 是 任何 的 相等 类 型 。 

从 a 开 始 的 grappi 的 深度 优先 搜索 按 图 3-lb 所 未 的 顺序 访问 诸 结 点 。 有 一 条 边 没 有 遍历 到 。 

让 我 们 用 上 面 的 函数 检查 一 下 这 个 遍历 : 

depthf (1"a"], graphl, (1); 

> ["a", "b", "e", "f", "g", "c", "d"] : string list 
添加 一 条 从 /到 d 的 边 使 得 该 图 有 了 一 个 圈 。 如 果 从 结 点 b 开 始 搜索 图 ， 那 么 园 的 一 条 边 会 被 忽 
略 。 另 外 ， 图 的 一 部 分 由 5b 根本 访问 不 到 ; 见 图 3-2。 
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depthf ({"b"], ("£","d")::graphl, []); 
> {"b", "e", "f", "d", "g"] : string list 
当 访问 了 一 个 之 前 没有 访问 过 的 结 点 x 之 后 ， 深 度 优先 搜索 递归 地 访问 每 一 个 x 的 后 继 。 在 通 
过 nexts(x, graph) @ xs 计算 出 的 表 中 ，x 的 后 继 都 被 放 在 了 其 他 等 待 访问 的 结 点 列表 xs 之 前 。 这 
个 表 的 作用 像 一 个 栈 。 如 果 这 个 表 被 作为 一 个 队列 的 话 ， 我 们 就 得 到 了 广度 优先 搜索 
(breadth-first search ) 。 
深度 优先 搜索 也 可 以 如 下 面 这 样 编写 : 
fun depth args = 
let fun rdepth ([], graph, visited) = visited 
| rdepth (x::xs, graph, visited) = 
rdepth (xs, graph, 
if x mem visited then visited 


else rdepth (nexts(x, graph), graph, x: :visited)) 
in rev(rdepth args) end; 
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在 内 层 递 归 ， 因 此 不 能 像 4depthf 的 迭代 式 递归 那样 直接 返回 rev visited， 和 那样 会 把 内 层 递 归 的 
中 间 结 果 也 翻转 了 。 我 们 利用 rdepth 来 返回 逆向 结果 ， 最 后 再 整体 做 一 次 翻转 。 两 个 函数 
depthf 和 depth 是 等 价 的 ， 虽然 证 明 这 个 需要 一 定 的 技巧 。 由 于 少 用 了 一 个 轧 加 调用 ( @)， 
depth 会 快 一 点 。 更 重要 的 是 ， 由 于 一 个 调用 专门 用 来 访问 结 点 x+， 可 以 很 容易 地 将 它 修改 以 检 


测 图 中 的 圈 ， 或 进行 拓扑 排序 。 


拓扑 排序 。 事 件 发 生 顺 序 的 约束 形成 了 一 个 图 。 每 一 条 边 xz~y 代 表 了 “x 必 须 在 7 之 前 发 


E” FE 
a . NS 
dress wash up 
shower eat 


wake 


描述 了 上 班 之 前 需要 做 的 事情 。 下 面 是 描述 这 个 图 的 代码 列表 : 


val grwork = [{("wake","shower"), ("shower","dress"), 
("dress", "go") , ("wake", "eat") ' 
(" eat", "washup") ， ( "washup" ， "go") ] ; 


从 图 中 找到 一 个 线性 的 事件 序列 被 称 为 拓扑 排序 (topological sorting). Sedgewick (1988) 
指出 ， 深 度 优先 搜索 可 以 完成 这 项 任务 ， 要 求 是 在 搜索 到 x 的 后 继 之 后 ， 将 x 记 录 下 来 。 这 样 


一 来 x 就 出 现在 它 所 能 到 达 的 所 有 结 点 之 后 : 反 向 的 拓扑 排序 。 


这 意味 着 对 depth 要 进行 简单 的 修改 : 把 x 放 在 递归 调用 的 结果 之 前 ， 而 不 是 它 的 参数 


visited 之 前 。 这 个 表 本 来 就 是 倒 着 生成 的 ， 所 以 不 需要 再 翻转 了 。 


fun topsort graph = 
let fun sort ((], visited) = 
| sort (x::xs, visited) = 
sort(xs, if x mem visited then visited 


visited 


else x :: sort(nexts(x, graph), visited) ) 
val (starts,_) = ListPair.unzip graph 
in 
Sort (starts, {]) 
end; 
> val topsort = fn : (''a * ’’a) list -> ’’a list 


let 声 明 让 sort 可 以 引用 graph， 它 也 声明 了 所 有 边 的 开始 结 点 starts 
都 能 被 访问 到 。 

那么 ， 我 们 上 班 前 要 怎样 进行 准备 呢 ? 

topsort grwork; 


> ["wake", "eat", "washup", "shower", "dress", "go"] 
> : string list 


翻转 表示 有 向 边 的 表 会 给 我 们 带 来 不 同 的 答案 : 


， 这 保证 了 图 的 所 有 结 点 
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topsort (rev grwork) ; 
> ["wake", "shower", "dress", "eat", "washup", "go"] 
> : string list l 


图 的 检测 。 现 在 考虑 多 一 个 约束 : 我 们 必须 在 “ 吃 ”(eat) 之 前 “ 走 ”(go)。 得 到 的 图 里 
面 有 一 个 圈 ， 没 有 任何 (拓扑 排序 的 ) 解 。 下 面 的 函数 调用 将 永远 运行 下 去 : 


topsort(("go", "“eat")::grwork) ; 


死 循 环 是 不 能 接受 的 ， 因 此 函数 应 该 以 某 种 方式 报告 没有 解 。 轿 可 以 通过 维护 一 个 正在 搜索 
的 所 有 结 点 的 表 来 检测 ， 这 个 表 岂 做 路 径 path， 它 从 搜索 一 开始 就 跟踪 经 过 的 边 。 


fun pathsort graph = 
let fun sort ([]， path, visited) 
| sort (x::xs, path, visited) 
if x mem path then hd] (*abort!!*) 
else sort(xs, path, 
if x mem visited then visited else 
x :: sort(nexts(x,graph) ,x: :path, visited) ) 
val (starts,_) = ListPair.unzip graph 
in sort(starts, [], []) end; 
> val pathsort = fn: (’’a * al list -> ’’a list 


StF RAS ik tea RE TE, OT AA. ERP TR: 


pathsort graphi; 

> ["a", "d", "c", "b", "e", "g", "£"] : string list 
pathsort(("go","eat") ::grwork) ; 

> Exception: Match 


visited 


错误 信息 要 比 死 循 环 好 得 多 ,但 是 pathsort 是 通过 一 个 错误 的 函数 调用 (hd []) 来 终止 运行 的 ， 
这 是 一 个 不 怎么 样 的 技巧 。 下 一 章 会 解释 怎样 为 这 种 错误 声明 一 个 异常 (exception)。 

异常 并 不 是 报告 存在 圈 的 唯一 办 法 。 下 面 的 函数 返回 两 个 结果 : 访问 过 的 结 点 的 表 ， 这 
跟 以 前 一 样 ， 以 及 在 围 中 所 发 现 的 结 点 的 表 。 为 了 维护 两 个 结果 ， 让 我 们 先 声 明 一 个 函数 来 
增加 访问 过 的 结 点 : 


fun newvisit (x, (visited,cys)) = (x:: visited, cys); 
> val newvisit = fn : ‘a * (’a list * ’b) -> ‘a list * ‘b 


有 了 这 个 函数 ， 表 示 拓 扑 排序 就 很 容易 了 : 


fun cyclesort graph = 
let fun sort ([1, path, (visited,cys)) = 
| sort (x::xs, path, (visited, cys)) = 
sort(xs, path, 
if x mem path then (visited, x: :cys) 
else if x mem visited then (visited, cys) 
else newvisit (x, sort (nexts (x, graph) , 
x::path, (visited, cys))))} 
val (starts,_) = ListPair.unzip graph 
in sort(starts, [}, ((],(])) end; 
> val cyclesort = fn 
> : (ʻa *’’a) list -> ‘’a list * ’’a list 


如 果 存 在 圈 ，cyclesort 会 报告 图 在 什么 地 方 : 


(visited, cys) 
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cyclesort (("go","eat") ::grwork); 
> ({"wake", "shower", "dress", "go", "eat", "washup"], 
> {["go"]) : string list * string list 


如 果 没 有 ，cyclesort 便 对 图 进行 排序 : 

cyclesort (rev graphl) ; 

> (["a", "b", "e", "d", "e", "f", ”"g"], []) 

> : string list * string list 
这 些 多 态 的 图 函数 对 于 大 图 是 很 惕 的 ， 因 为 进行 了 很 多 表 的 搜索 。 如 果 将 结 点 限制 在 整数 类 
型 上 ， 则 可 以 利用 下 一 章 的 函数 式 数 组 来 写 出 效率 更 高 的 函数 。 


练习 3.36 ”修改 pathsor:， 当 图 含有 圈 时 返回 []， 否 则 返回 单元 素 表 [visited] 。 


练习 3.37 设 (visited, cys) 是 cyclesort 的 结果 。 如 果 图 里 面 有 多 个 圈 ， 每 个 圈 都 会 有 一 个 结 点 
在 cys 里 面 吗 ? 如 果 图 里 面 有 图 ，visited 里 面 返回 的 是 什么 ? 


排序 : 案例 研究 


排序 是 计算 理论 中 研究 最 多 的 题目 之 一 。 有 些 排序 算法 非常 出 名 。 要 将 "个 元 素 排序 ， 播 
入 排序 (insertion sort) REOR; 合并 排序 (merge sort) 需要 O(n log niti; 快速 排 
序 (quick sort) 平均 需要 O(n log HA, MRM ZO’). 

这 些 算法 通常 是 对 数组 进行 排序 。 除 了 堆 排序 (heap sort) ， 它 用 数组 来 编码 存放 一 棵 二 
叉 树 ， 其 他 的 都 可 以 很 容易 地 写成 作用 于 表 的 函数 。 它 们 的 时 间 复 杂 度 也 保持 不 变 : 并 不 是 
说 表 的 排序 会 在 速度 上 胜 过 数组 ! O(n”) 的 时 间 复 杂 度 估计 是 指 执行 时 间 和 ?成 正比 。 而 表 的 
排序 会 有 较 大 的 比例 系数 。 

这 一 节 比 较 了 几 种 排序 算法 ， 给 出 了 将 10 000 个 随机 数 排序 的 时 间 。 这 些 时 间 并 不 是 正 
式 的 ， 但 也 体现 出 各 种 算法 实践 上 的 性 能 。 

Sedgewick (1988) 所 写 的 Pascal 版 本 的 快速 排序 可 以 在 110 毫 秒 内 完成 排序 。 这 与 函数 式 
排序 的 最 好 时 间 相 仿 。Pascal 在 一 些 检测 被 省 掉 后 要 胜 过 ML ， 但 是 却 牺 和 性 了 函数 式 程序 设计 
的 清晰 和 简洁 ， 更 不 用 说 安全 了 。 表 的 开销 在 排序 里 面 并 不 很 重要 ， 比 如 排序 一 个 参考 文献 
表 ， 时 间 主 要 是 花 在 比较 上 面 了 。 


加 | 时 间 是 怎样 测量 的 。 时 间 测 重 是 在 一 台 Sun SuperSPARC Model 61 计 算 机 上 进行 
的 ， 运 行 的 是 Standard ML of New Jersey, version 108。 测 量 利 用 了 标准 库 中 的 设施 
(Timer 结 构 )，、 并 且 包 括 了 垃圾 收集 的 时 间 。 感 谢 软 件 和 硬件 的 进步 ，ML 程 序 比 写 
这 本 书 第 一 版 的 时 候 快 了 20 ~ 40 倍 。 

Pascal 程 序 是 使 用 Pascal 3.0 编 译 器 编译 的 。 不 使 用 数组 下 标 检 测 的 话 ， 时 间 下 降 
到 了 75 毫 秒 。 如 果 使 用 完全 优化 的 话 ， 程 序 只 需 34 吉 秒 便 完 成 了 ， 但 是 之 后 打出 了 
一 个 警告 消息 : 它 “ 可 能 输出 了 非 标 准 的 浮 点 数 结果 ”。 在 追求 速度 的 道路 上 ， 我 们 
值得 置 什么 样 的 风险 呢 ? 


3.18 随机 数 
首先 我 们 必须 产生 10 000 个 随机 数 。Park 和 Miller (1988)， 在 抱怨 很 难 找到 好 的 随机 数 
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发 生 器 的 情况 下 ， 推 荐 了 下 面 的 算法 : 


local val a = 16807.0 and m = 2147483647.0 
in fun nextrand seed = 


let val t = a*seed 


in t- m * real(floor(t/m)) end 
end; 


> val nextrand = fn : real -> real 


调用 nextrand， 传 入 从 1 到 m1 之 间 的 任何 seed 就 会 产生 在 此 范围 内 的 另 一 个 数 ， 它 实际 上 进 
行 了 下 面 的 整数 运算 
(a x seed) mod m 

使 用 实数 是 为 了 避免 整数 溢出 。 只 要 实数 尾数 足够 46 位 ， 这 个 函数 就 能 正确 运行 。 当 在 你 的 
机 器 上 试验 的 时 候 ， 要 检查 一 下 产生 的 随机 数 是 否 恰好 是 整数 。 

调用 函数 randlist(n, seed, 中 产生 一 个 从 seed 开 始 的 具有 n 个 元 素 的 随机 数 表 。 由 于 表 是 在 
tail 中 积累 的 ， 因 此 它 的 顺序 是 倒 的 : 

fun randlist (n,seed,tail) = 


if n=0 then (seed, tail) 


else randlist(n-1, nextrand seed, seed: :tail); 
> val randlist = fn 


> : int * real * real list -> real * real list 


10 000 BEL RHA rs. Pitas TA1S+. 


val (seed,rs) = randlist(10000, 1.0, []): 


> val seed = 1043618065.0 : real 

> val rs = 

> [1484786315.0, 925166085.0, 1614852353.0, 721631166.0, 

> 173942219.0, 1229443779.0, 789328014.0, 570809709.0, 

> 1760109362.0, 270600523.0, 2108528931.0, 16480421.0, 

> 519782231.0, 162430624.0, 372212905.0,...] : real list 
3.19 插入 排序 

插入 排序 是 将 元 素 一 次 一 个 地 插入 到 已 经 排序 的 表 中 。 它 很 慢 ， 不 过 简单 。 下 面 是 插入 
函数 : 

fun ins (x, []): real list [x] 


| ins (x, y::ys) 
if x<=y then x::y::ys (* 它 属 于 这 里 *) 
else y: :ins(x,ys); 
> val ins = fn : real * real list -> real list 


类 型 约束 real list 解 决 了 比较 操作 符 的 重 载 问 题 。 所 有 排序 函数 都 有 类 型 约束 。 
我 们 向 显然 是 有 序 的 表 [6.0] 中 插入 一 些 数 : 


ins(4.0, [6.0]); 

> [4.0, 6.0] : real list 
ins(8.0,it); 

> [4.0, 6.0, 8.0] : real list 

ins (5.0, it); 

> (4.0, 5.0, 6.0, 8.0] : real list 
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插入 排序 函数 对 每 一 个 输入 的 元 素 调用 ins: 
fun insort [] [] 


| insort (x: :xs) ins (x, insort xs); 
> val insort = fn : real list -> real list 


这 些 函 数 都 需要 深层 递归 ， 不 过 这 方面 的 低 效 并 不 重要 。 揪 人， 无论 是 函数 式 的 还 是 命令 式 
的 ， 都 需要 做 大 量 的 复制 。 运 行 时 间 和 闫 成 正比 。 对 于 我 们 的 10 000 个 数 来 说 是 超过 32 秒 ， 大 
约 比 快速 排序 慢 300 倍 。 插 入 排序 只 能 考虑 对 短 表 使 用 ， 或 对 于 几乎 排 好 的 表 使 用 。 这 个 算法 


还 是 值得 注意 的 ， 因 为 它 很 简单 ， 也 因为 在 它 的 基础 上 ， 能 提炼 出 更 好 的 算法 (合并 排序 和 
堆 排序 )。 


3.20 快速 排序 


HC. A. R. Hoare 发 明 的 快速 排序 是 最 快 的 排序 之 一 。 它 的 原理 是 分 治 法: 

。 从 输入 中 选择 某 个 值 c， 称 为 主 元 (pivot). 

。 将 剩 下 的 项 目 分 为 两 部 分 : 一 部 分 小 于 或 等 于 a， 另 一 部 分 大 于 a。 

。 分 别 递 归 地 排序 两 个 部 分 ， 并 将 小 的 那 部 分 放 在 大 的 前 面 。 
快速 排序 对 于 数组 是 很 理想 的 ， 分 区 的 操作 极 快 ， 只 需要 移动 很 少 的 项 。 对 于 表 ， 分 区 需要 
复制 所 有 的 项 ; _ partition 是 一 个 不 错 的 友 代 函数 的 例子 ， 它 构造 出 两 个 结果 。 


fun quick [)j = {) 
| quick [x] = [x] 
| quick (a::bs) = (* 表 头 "a" 是 主 元 *) 


let fun partition (left, right, {]): real list = 
(quick left) @ (a :: quick right) 
| partition (left, right, x::xs) = 
if x<=a then partition (x: :left, right, xs) 
else partition (left, x::right, xs) 
in partition((),{},bs) end; 
> val quick = fn : real list -> real list 


这 个 函数 将 我 们 的 10 000 个 数 进 行 排序 ， 用 了 大 约 160 毫 秒 : 

quick rs; 

> [1.0, 8383.0, 13456.0, 16807.0, 84083.0, 86383.0, 

> 198011.0, 198864.0, 456291.0, 466696.0, 524209.0, 

> 591308.0, 838913.0, 866720.0, ...] : real list 
通过 使 用 第 二 个 参数 来 积累 结果 ， 追 加 操作 (e) 是 可 以 避免 的 。 这 个 版 本 的 快速 排序 留 作 练 
习 ， 它 只 需要 110 毫 秒 。 

和 相应 的 过 程式 程序 一 样 ，quick 平 均 需 要 和 n log n 成 正比 的 时 间 。 如 果 输 入 已 经 是 升序 
或 者 降序 的 话 ， 快 速 排序 则 需要 和 成 正比 的 时 间 。 


练习 3.38 重新 表达 快速 排序 ， 使 得 quicker(xs, sorteg) 通 过 sorted 来 积累 结果 ， 从 而 省 去 追加 
操作 。 


练习 3.39 书写 函数 find， 使 得 find(xs, i) 返 回 表 xs 中 第 i 小 的 元 素 。 这 被 称 为 选择 (selection )。 
Hoare 的 算法 和 快速 排序 有 关 ， 并 且 以 比 排序 快 得 多 的 速度 返回 第 i 企 元 素 。 


练习 3.40 推广 find， 使 得 findrange(xs,i, 站 返回 表 xs 中 第 i 小 到 第 j 小 之 闻 的 元 素 列 表 。 
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3.21 合并 排序 


有 几 个 算法 是 基于 合并 已 排序 的 表 来 工作 的 。 合 并 函数 不 断 地 从 两 个 表 中 提取 较 小 的 那 
个 表 头 元 素 : 
fun mergel[] ,ys) = ys : real list 
| merge (xs, {}) = xs 
| merge (x: :xs, y::ys) = 
if x<=y then Xx: :merge(xs, y::ys) 
else y: :merge (Xx: :Xxs, YS); 
> val merge = fn : real list * real list -> real list 


当 排 序 10 000 个 项 目 时 ，merge 中 的 递归 对 于 有 些 ML 系 统 来 说 是 过 深 了 。 这 是 那些 ML 系统 的 
问题 ， 而 不 是 merge 的 问题 。 像 1ake 和 append 一 样 ， 主 要 的 开销 是 用 于 构造 结果 。 迭 代 的 合并 
函数 ， 虽 然 避免 了 深层 的 递归 ， 但 是 却 很 可 能 必须 进行 昂贵 的 翻转 操作 。 
合并 排序 可 以 是 自 顶 向 下 的 (top-down)， 也 可 以 是 自 底 向 上 的 《bottom-up ) 。 不 论 哪 一 
种 ， 合 并 只 有 在 两 个 表 的 长 度 差 不 多 的 时 候 才 是 有 效 的。 如 果 其 中 一 个 表 只 有 一 个 元 素 ， 那 
么 合并 就 退化 成 了 插入 。 
自 顶 向 下 的 合并 排序 。 在 自 顶 向 下 的 方法 中 ， 输 入 的 表 利 用 take 和 drop 被 分 成 长 度 大 致 相 
等 的 两 部 分 。 对 它们 分 别 递归 地 进行 排序 ， 然 后 把 结果 合并 在 一 起 。 
fun tmergesort [] {} 
| tmergesort [x] [x] 
| tmergesort xs 
let val k = length xs div 2 


in merge (tmergesort (List.take (xs,k)), 
tmergesort (List .drop(xs,k))) 


end; 
> val tmergesort = fn : real list -> real list 
不 像 快速 排序 ， 合 并 排序 在 最 坏 情 况 下 需要 的 时 间 仍 和 mn log nr 成 正比 。 但 是 平均 来 说 ， 它 比 
较 慢 ， 需 要 290 毫 秒 来 排序 10 000 个 数 。 它 对 于 length、take 和 drop 的 调用 重复 地 扫描 了 输入 的 
表 。 下 面 是 减少 重复 扫描 的 一 种 办 法 : 


fun mergesort xs = 


let fun sort (0, xs) ([], xs) 


| sort (1, x::xs) = ([x], xs) 

| sort (n, xs) = 
let val (ll, xsl) = sort ((n+1) div 2, xs) 

val (12, xs2) = sort (n div 2, xsl) l 
in (merge (11,12), xs2) 
end 
val (l, _) = sort (length xs, xs) 
in | end 


> val mergesort = fn : real list -> real list 


调用 sort(n, x9) 将 xs 的 前 "个 元 素 排序 ， 并 将 剩 下 元 素 的 一 起 返回 (在 结果 的 第 二 个 分 量 中 )。 有 
人 可 能 会 觉得 它 慢 ， 因 为 它 构 造 了 很 多 的 序 偶 。 但 是 这 个 函数 只 需要 200 毫 秒 来 排序 我 们 的 随机 
数 表 。 虽 然 它 仍然 比 快速 排序 要 慢 ， 但 是 已 经 可 以 作为 简单 而 快速 的 排序 方法 ， 推 荐 给 大 家 了 。 

自 底 向 上 的 合并 排序 。 基 本 的 自 底 向 上 方法 是 将 整个 输入 表 分 割 成 长 度 为 1 的 表 。 然 后 千 
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在 一 起 的 表 就 可 以 被 合并 了 ， 得 到 有 序 的 长 度 为 2 的 表 ， 然 后 是 长 度 为 4 的 表 ， 然 后 是 长 度 为 8 
的 表 ， 依 此 类 推 。 最 后 就 只 剩 下 一 个 有 序 的 表 了 。 这 个 方案 很 容易 编码 ， 但 是 非常 浪费 。 为 
什么 10 000 个 数 的 表 要 被 复制 成 10 000 个 单元 素 表 呢 ? 

O’Keefe (1982) 描述 了 一 个 漂亮 的 方法 来 同时 合并 不 同 长 度 的 表 ， 而 无 须 完整 地 存储 这 
些 表 。 


ABCDEFGHIIK 
下 划 线 显示 了 相 邻 的 表示 是 怎样 被 合并 的 。 首 先是 4 和 B， 然 后 是 C 和 D， 现 在 4B 和 CD 拥有 相 
同 的 长 度 ， 于 是 又 可 以 合并 了 。O'Keefe 加 快 了 将 所 有 层次 的 合并 积累 在 一 个 表 中 的 速度 。 它 
不 去 比较 两 个 表 的 长 度 ， 而 是 让 成 员 的 计数 上 去 决定 如 何 加 入 下 一 个 成 员 。 如 果 K 是 偶数 ， 那 
么 说 明 有 两 个 长 度 同 为 的 成 员 需 要 合并 。 合 并 之 后 的 表 作 为 具有 长 度 2s 的 成 员 k/2， 它 可 能 引 
起 进一步 的 合并 。 

fun mergepairs( [ 门 ， k) = 

| mergepairs(11::12::Is, k) = 
if k mod 2 = 1 then /1::12::ls 
else mergepairs (merge (ll ,12)::ls, k div 2); 

> val mergepairs = fn 

> : real list list * int -> real list list 
如 果 k = 0 那么 mergepairs 就 将 整个 表 的 表 合 并 成 一 个 表 。 调 用 sorting(xs, [D], 0) 排 序 表 xs。 
它 需 要 270 毫 秒 来 排序 10 000 个 随机 数 。 

fun sorting({], ls, k) = hd(mergepairs(is,0)) 

| sorting (x::xs, Is, k) = 
Sorting (xs, mergepairs((x)::ls, k+1), k+1); 

> val sorting = fn 

> : real list * real list list * int -> real list 
k 可 以 理解 为 一 个 计数 器 , 是 当前 加 入 合并 的 输入 子 表 数目 (这 里 是 单元 素 表 ， 但 不 局 限于 此 )。 
如 果 把 kK 写成 二 进 制 数 ， 就 可 以 体会 mergepairs 的 巧妙 之 处 。 事 实 上 mergepairs 相 当 于 二 进 制 
加 法 的 进位 过 程 ， 在 K 不 为 0 时 ， 把 K 个 输入 子 表 合 并 成 上 的 二 进 制 表示 中 1 的 个 数 那 么 多 个 子 表 。 
如 果 K 加 一 以 后 导致 二 进 制 表示 的 右 端 出 现 0， 那 么 有 多 少 个 连续 的 0， 原 先 上 的 右 端 就 有 多 少 
个 连续 的 1， 也 就 合并 这 么 多 个 子 表 成 为 一 个 新 的 子 表 。 一 -一 译 者 注 

+ (smooth) 排序 在 输入 基本 有 序 的 情况 下 具有 线性 (和 成 正比 ) 的 时 间 复 杂 度 ， 而 
在 最 坏 的 情况 下 退化 回 O(n log n)。O’Keefe 利 用 输入 的 有 序 性 ， 展 示 了 一 种 “平滑 应 用 式 合 
并 排序 ” 。 他 把 输入 分 成 一 个 个 自身 升序 的 行程 ， 来 取代 单元 素 表 。 如 果 行 程 的 数目 和 m 无 关 
(也 就 是 “基本 有 序 " ) ， 那 么 运行 时 间 就 是 线性 的 。 

函数 nextrun 从 表 中 取得 下 一 个 升序 的 行程 ， 并 与 剩 下 的 ， 没 有 读 到 的 项 所 组 成 的 表 配 对 
一 起 返回 。( 命 令 式 程序 会 将 处 理 过 的 项 删除 。) 行程 表 是 反 向 增长 的 ， 所 以 要 调用 rev。 


fun nextrun(run, []) = (rev run, []: real list) 
| mextrun (run, x::xs) = 
if x < hd run then (rev run, xX: :xs) 
else nextrun (x: :run, Xs); 








U) 


> val nextrun = fn 
> : real list * real list -> real list * real list 
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行程 表 不 断 地 被 取出 和 合并 的 。 


fun samsorting((], ls, k) 
| samsorting (x: :xs, Is, k) 
let val (run, tail) = nextrun([x], xs) 
in samsorting (tail, mergepairs(run::ls,k+1), k+1) 
end; 
> val samsorting = fn 
> : real list * real list list * int -> real list 


hd (mergepairs (Is, 0) } 


最 后 ， 主 排序 函数 为 
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fun samsort xs = samsorting(xs, {{1], 0); 
> val samsort = fn : real list -> real list 


这 个 算法 既 典 雅 又 高 效 。 即 使 是 对 于 短 行程 的 随机 数 序列 ， 运 行 时 间 也 只 有 250 毫 秒 。 


历史 注解 。 对 于 表 的 排序 类 似 在 磁带 上 排序 。 随 机 访问 是 低 效 的 ; 数据 必须 按 
顺序 正 向 或 反 向 地 扫描 。 关 于 磁带 排序 方面 的 文献 是 很 奇妙 的 ， 虽 然 已 经 很 过 时 了 ， 
但 却 能 提供 有 用 的 思想 。mergepairs 中 使 用 的 技术 非常 类 似 于 20 世 纪 60 年 代 开发 的 摆 
动 排序 (Knuth, 1973, 5.4.5), 

合并 排序 很 少 用 于 数组 ， 因 为 它 不 能 原 地 完成 : 需要 两 个 数组 。 即 便 如 此 ， 曲 
在 1945 年 就 已 经 被 提出 了 ; 在 输入 中 利用 行程 的 思想 也 相当 古老 了 (Knuth, 1973, 
5.24). 


6353.41 利用 下 面 的 函数 来 编写 一 个 新 版 本 的 自 顶 向 下 合并 排序 ， 并 测量 它 的 速度 。 解 释 
一 下 你 的 发 现 ， 如 果 可 能 的 话 ， 测 量 时 把 垃圾 收集 的 时 间 也 算 进 去 。 
fun alts ({],xs,ys) xs, ys) 


= ( 
| alts ({x],xs,ys) = (x: :Xs, ys) 
| alts (x::y::l, xs, ys) = alis(l, Xx: :Xs, y::ys); 


练习 3.42 ”和 上 面 的 练习 一 样 ， 只 是 你 要 基于 下 面 的 函数 编写 新 的 排序 函数 : 


fun takedrop ([], n, xs) = (xs, []) 
| takedrop (x::l, n, xs) = 
if n>0 then takedrop(l, n-1, x::xs) 
else (xs, x::1); 


练习 3.43 ”为 什么 是 调用 sorting(xs, [[]1,0)， 而 不 是 调用 sorting(xs, {], 0)? 
练习 3.44 ”书写 一 个 新 版 本 的 samsort， 同 时 利用 升序 和 降序 行程 。 


多 项 式 算术 


计算 机 是 为 了 进行 数值 运算 而 发 明 的 。 它 们 很 善于 用 图 解 的 方法 描绘 数据 。 但 是 有 时 没 
有 什么 可 以 比 一 个 符号 公式 提供 的 信息 更 多 了 。 公 式 E = mc 的 图 只 是 简单 的 一 条 直线 。 

计算 机 代数 《computer algebra) 所 关心 的 是 关于 符号 数学 的 自动 化 ， 科 学 家 和 工程 师 都 
要 用 到 符号 数学 。 像 MACSYMA 和 REDUCE 这 样 的 系统 可 以 完成 涉及 到 微分 、 积 分 、 客 级 数 
扩展 等 惊人 的 任务 。 最 基本 的 符号 运算 是 进行 多 项 式 算术 。 即 使 是 这 个 ， 也 很 难 高 效 地 完成 。 
我 们 将 把 自己 限制 在 最 简单 的 情形 一 一 一 元 多 项 式 上 。 一 元 多 项 式 只 有 一 个 变 元 x; 它们 可 以 
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非常 直接 地 进行 加 法 和 乘法 运算 : 
(+1+(O2 -2)=xr%4x-1 


(x+1)*x OG? -2)=x 4+2x°-2x-2 


在 为 一 元 多 项 式 开发 算术 包 的 时 候 ， 涉 及 到 了 数据 表示 这 个 一 般 性 的 问题 。 我 们 要 实现 加 法 
和 乘法 , 会 用 到 前 面 章节 的 排序 思想 。 我 们 还 会 遇 到 另 一 个 满足 2.22 节 4R1TZ 签 名 的 算术 结构 。 
最 后 ， 要 考虑 如 何 找到 最 大 公 因 式 ， 即 使 在 一 元 的 情况 下 ， 这 也 是 一 个 挑战 。 

这 个 代码 速度 很 快 ， 能 在 2 秒 内 计算 (* + 1)”， 表 现 了 该 工具 的 强大 能 力 。 


3.22 表示 抽象 数据 


在 3.15 节 ， 我 们 考虑 过 有 限 集合 的 操作 ， 例 如 并 和 集 和 子 集 。ML 并 不 提供 有 限 集合 作为 一 
种 数据 结构 ; 我 们 是 通过 没有 重复 元 素 的 表 来 表示 它 的 。 虽然 有 限 集合 可 能 看 上 去 很 简单 ， 
但 是 它 却 展示 了 数据 表示 中 涉及 到 的 大 部 分 问题 。 

一 个 抽象 对 象 集 ， 比 如 有 限 集合 ， 是 通过 一 个 具体 对 象 的 集合 ， 比 如 某 些 表 ， 来 表示 的 。 
每 个 抽象 对 象 都 至 少 可 以 表示 为 一 个 具体 对 象 。 有 可 能 不 止 一 个 : 回忆 一 下 {3,4} 可 以 被 表示 
为 [3, 4] 和 [4, 3]。 而 有 些 具体 对 象 ， 比 如 [3, 3]， 根 本 表示 不 了 抽象 对 象 。 

抽象 数据 上 的 操作 是 根据 其 表示 方法 来 定义 的 。 例 如 ， 只 要 对 于 分 别 表示 集合 4 和 A' 的 
所 有 表 ! 和 来 说 ，union(1, l' ) 都 表示 了 A 和 A4' 的 并 集 ， 那 么 就 可 以 说 ML 函数 union 实 现 了 抽象 
函数 “并 集 ”。 再 如 ， 只 要 对 于 分 别 表示 和 集合 4 和 A4' 的 所 有 表 ! 和 /1 来 说 ， 当 且 仅 当 4 是 4' 的 子 
集 时 ，! subs L 都 为 真 ， 那么 就 可 以 说 ML 的 谓词 subs (一 个 中 组 操作 符 ) 实现 了 抽象 关系 
“属于 ”。 相 等 关系 也 是 类 似 看 待 的 ， 我 们 并 没有 要 求 相等 的 集合 有 相等 的 具体 表示 。 

这 些 问 题 在 我 们 每 天 使 用 计算 机 的 时 候 都 会 出 现 ， 计 算 机 最 终 是 用 零 和 一 来 表示 所 有 的 
数据 的 。 一 些 更 深入 的 问题 只 能 在 这 里 提 一 下 ， 例 如 计算 机 用 浮 点 数 来 表示 实数 ， 然 而 大 部 
分 的 实数 都 无 法 这 样 表示 ， 实 数 运算 只 能 近似 地 实现 。 

3.23 多 项 式 的 表示 
让 我 们 来 考虑 一 下 如 何 表示 形 如 下 式 的 一 元 多 项 式 
A,X" + + dy X? 
由 于 只 有 一 个 变 元 ， 它 的 名 字 就 没 必要 存储 了 。 系 数 a,, …, do 有 可 能 是 实数 ， 但 是 实数 运算 在 
计算 机 里 面 又 是 近似 的 。 我 们 应 该 把 系数 用 有 理 数 来 表示 ， 也 就 是 没有 公约 数 的 整数 序 偶 ( 参 
见 练习 2.25)。 不 过 这 只 是 些 枝 节 问题 ， 再 说 它 又 需要 任意 精度 的 整数 ， 某 些 ML 系统 并 不 支持 。 
因此 ， 在 不 是 很 影响 严格 性 的 情况 下 ， 权 宜 的 办 法 就 是 用 ML 的 实数 来 表示 多 项 式 系数 。 

我 们 也 许可 以 将 多 项 式 表 示 成 系数 的 列表 ，[a,, …, Qao]。 但 为 了 看 出 这 个 办 法 不 合适 ,不 
妨 考 虑 一 下 多 项 式 ro + 1， 以 及 它 的 平方 ! 在 一 个 典型 的 多 项 式 中 许多 系数 都 是 零 。 我 们 需 
要 的 是 一 个 稀 鸡 (sparse) 的 表示 方法 ， 而 不 是 早先 用 来 表示 矩阵 的 密集 (dense) 方法 。 

让 我 们 把 多 项 式 表 示 为 代表 每 一 个 非 零 系 数 a 的 ， 形 如 (k, ab 的 序 偶 表 。 序 偶 在 表 中 应 该 
按 k 的 降序 排列 ; 这 样 便于 合并 指数 相同 的 项 。 例 如 ，[(2, 1.0), (0, "2.0)] 表 示 了 多 项 式 x - 2. 

这 个 表示 要 比 有 限 集 合 的 表示 好 ， 因 为 每 一 个 抽象 的 多 项 式 只 有 唯一 的 具体 表示 。 两 个 
多 项 式 是 相等 的 当 且 仅 当 表示 它们 的 表 是 相等 的 。 但 是 并 不 是 所 有 ( 整数， 实数 ) 的 序 偶 表 
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我 们 应 该 将 多 项 式 声明 为 抽象 类 型 ， 隐 藏 下 面 的 表 。 不 过 现在 ， 还 是 让 我 们 先 把 多 项 式 
操作 按照 签名 ARITH 包 装 到 一 个 结构 中 去 。 
structure Poly = 
struct 
type t = (int*real) list; 
val zero= []; 
fun sum... 
fun diff 
fun prod ... 


fun quo 
end; 


这 里 ， 坦 表示 多 项 式 的 类 型 ，zero 是 表示 零 多 项 式 的 空 表 。 其 他 的 组 件 将 在 下 面 介绍 。 
3.24 ”多项式 加 法 和 乘法 


计算 两 个 多 项 式 的 和 就 像 合 并 对 应 的 表 ， 如 CG - x) + QP + Dae +2 -x+1。 不 过 ， 
相似 的 项 要 合并 ， 且 零 系 数 项 要 消除 ， 比 如 (x -x+3)+-5)=2-2。ML 国 数 的 定义 是 根 
据 我 们 笔算 的 方法 得 来 的 : 


fun sum ([], us) 


= us: f 
| sum (ts, (1) = ts 
| sum ((m,a)::ts, (n,b)::us) = 
if m>n then (m,a) :: sum (ts, (n,b)::us) 
else if n>m then (n,b) :: sum (m, (m,a) : :us) 


else (* m=n *) 
if Real.==(a+b,0.0) then sum (ts, us) 
else (m, a+b) :: sum (ts, us); 


两 个 多 项 式 的 积 是 根据 分 配 率 来 计算 的 。 其 中 一 个 多 项 式 的 每 一 项 都 去 乘 以 另 一 个 多 项 式 ， 
然后 将 结果 加 起 来 。 
(x7 + 2x — 3) x (2x — 1) = L (2x — 1) + 2x(2x — 1) — 32x — 1) 
= (2x? — x*) + (4x° — 2x) + (—6x + 3) 
= 2° +3 —~ 8x43 
为 了 实现 这 个 方法 ， 首 先 需 要 一 个 函数 来 将 一 项 和 一 个 多 项 式 乘 起 来 : 


fun termprod ((m,a)，[]) 
| termprod ((m,a), (n,b)::ts) = 


[] :+ 


(m+n, a*b) :: termprod ((m,a), ts); 
朴素 (naive) 的 乘法 算法 完全 按照 上 面 的 例子 : 


fun nprod ([], us) = {] 
| nprod ((m,a)::ts, us) = sum (termprod ((m,a), us), 
nprod (ts, us)); 
更 快 的 来 法 。 实 验 表明 nprod 对 于 大 型 的 多 项 式 来 说 是 太 慢 了 。 它 需要 超过 两 秒 钟 以 及 多 次 的 
垃圾 收集 才能 完成 (e+ 1 的 平方 计算 。( 如 此 大 型 的 多 项 式 在 计算 机 代数 中 很 常见 。) 原因 
是 sum 合 并 的 都 是 长 度 差 得 很 远 的 表 。 如 果 二 和 us 各 有 100 项 ， 那 么 termprod((m, a), us) 也 只 有 
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100 项 ， 而 nprod(1s, us) 却 有 可 能 多 达 10 000 项 。 它 们 的 和 最 多 有 10 100 项 ， 只 增长 了 1%。 

合并 排序 启发 了 一 个 更 快 的 算法 。 把 其 中 一 个 多 项 式 分 成 两 半 ， 分 别 递 归 地 计算 它们 和 
另 一 个 多 项 式 的 积 ， 然 后 将 两 个 积 加 起 来 。 尽 管 这 形成 了 和 之 前 一 样 多 的 加 法 ,但 是 它们 是 
平衡 的 : 我 们 计算 (pi +p) + (ps + ps)， 而 不 是 pi + (pz + (pi + p4))。 平均 来 讲 ， 被 加 数 都 较 小 ， 
而 且 每 加 一 次 都 会 使 结果 长 度 加 倍 。 


[] 
termprod ((m,a), us) 


fun prod ([] us) 
| prod ({(m,a)], us) 
| prod (ts, us) 
let val k = length ts div 2 
in sum (prod (List.take(ts,k), us), 
prod (List.drop(ts,k), us)) 


ou B 


end; 


这 个 在 计算 (Ce + Do 的 平方 时 是 aprod 速 度 的 三 倍 ， 而 且 多 项 式 越 大 ， 速 度 越 快 。 

运行 一 些 例子 。 虽 然 我 们 尚未 完全 定义 结构 Poly， 不 妨 先 假设 它 已 经 定义 好 了 ， 并 包括 
一 个 将 多 项 式 显示 成 字符 串 的 函数 show。 我 们 来 计算 这 部 分 一 开始 的 那 两 个 多 项 式 x + 1 和 
一 2 的 和 与 积 : 


val pl 


= [(1,1.0),(0,1.0)] 
and p2 = [ 


(2,1.0),(0,72.0)]); 


Poly.show (Poly.sum (pl, p2)); 

> "*K°2 +x - 1.0" : string 

Poly.show (Poly.prod (pi, p2)); 

> "x°3 + x°2 - 2.0x - 2.0" : string 
结构 Po1y 也 提供 指数 操作 。 国 数 power 是 像 2.14 节 里 那样 定义 的 。 为 了 看 一 个 大 一 点 的 例子 ， 
让 我 们 计算 一 下 (x - 1)": 


val xminusl = [(1,1.0), (0,71.0)]; 


é 
t 


Poly.show (Poly.power (xminusl, 10)); 

> "x°10 - 10.0x°9 + 45.0x°8 - 120.0x^°7 + 210.0x°6 
> - 252.0x^5+ 210.0x^°4 - 120.0x^°3 + 45.0x°2 

> - 10.0x + 1.0" : string 


FRC? ~ 2)” 的 头 几 项 : 


Poly.show (Poly.power (p2, 150)); 
> "*°300 - 300.0x°298 + 44700.0x°296 
> ~- 4410400.0x°294 + 324164400.0x°292..." : string 


练习 3.45 ”编写 di 好 ， 计 算 两 个 多 项 式 的 差 。 利 用 termprod 来 写 只 需 一 行 代码 ， 不 过 效率 
不 高 。 


练习 3.46 编写 show， 这 个 函数 要 产生 像 上 面 正文 中 那样 的 输出 。( 函数 Real.toString 和 
Int.toString 将 数 转换 成 字符 串 。) 


练习 3.47 给 出 一 个 具 说 服 性 的 讨论 ， 说 明 sum 和 prod 都 是 符合 多 项 式 的 表示 方式 的 。 


练习 3.48 ”我 们 所 说 的 sum 正 确 地 计算 了 两 个 多 项 式 的 和 ， 这 到 底 是 什么 含义 ?你 会 怎样 证 
明 它 ? 
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3.25 最 大 公 因 式 


很 多 应 用 都 涉及 到 有 理 函 数 (rational function): 多 项 式 的 分 式 。 为 了 效率 ， 需 要 分 式 的 
分 子 和 分 母 没有 公 因 式 。 因此， 我 们 需要 一 个 函数 来 计算 两 个 多 项 式 的 最 大 公 因 式 (GCD). 
这 要 求 有 函数 来 计算 多 项 式 的 商 式 和 余 式 。 

多 项 式 除法 。 多 项 式 除法 的 算法 类 似 于 普通 的 长 除法 。 实 际 上 它 要 更 容易 些 ， 因 为 它 不 
需要 猜测 商 数 。 每 一 步 都 会 消去 被 除 式 的 首 项 ， 这 是 通过 用 除 式 的 首 项 去 除 被 除 式 的 首 项 来 
完成 的 。 这样 做 的 每 一 步 都 会 产生 一 项 商 式 。 让 我 们 用 2z + x - 3 除 以 xz - 1: 





2x 十 3 

x—1)2x2 + x-3 
2x* — 2x 

3x- 3 

3x 一 3 

0 


这 里 ， 余 式 是 零 。 一 般 情 况 下 ， 余 式 是 一 个 多 项 式 ， 它 的 首 项 指数 ( 称 为 它 的 次 数 ) 要 比 除 
式 的 次 数 小 。 让 我 们 将 妇 + 2x? - 3x + PREP +x 一 2， 得 到 余 式 -2x +3: 


x+1. 
x? +x—2)x3 + 2x? — 3x41 
L+ x2 —2x 
xX- x+! 
X+ x 一 2 
一 2x 十 3 


如 果 除 式 的 首 项 系数 不 是 1 的 话 ， 那 么 很 可 能 会 出 现 分 数 。 这 会 令 计 算 更 加 缓慢 ， 但 它 却 不 会 
使 基本 算法 复杂 化 。 函 数 quorem 直 接 实现 了 刚才 所 示 的 方法 ， 它 返回 一 个 序 偶 ( 商 式 ， RR). 
其 中 商 式 的 形成 是 倒 着 的 。 


fun quorem (ts, (n,b)::us) = 
let fun dividing ({], qs) = (rev qs, []) 
| dividing ((m,a)::ts, qs) = 
if m<n then (rev qs, (m,a)::ts) 
else dividing (sum (ts, termprod ((m-n, ~a/b), us)), 
(m-n, a/b) :: qs) 
in dividing (ts, []) end; 


因为 (x 一 1) x (e+ 1) = 2° - 1, BRE? -2 除 以 x - 1 得 到 商 式 x + 1 和 余 式 -1。 假 设 Poly 包 
含 quorem， 以 及 可 以 显示 一 对 多 项 式 的 函数 showpair: 


Poly.quorem (p2, xminusl) ; 
> ([(1, 1.0), (0, 1.0)], [(0, ~1.0)]) 


> : (int * real) list * (int * real) list 
Poly. showpair it; 
> "x + 1.0, - 1.0" : string 


让 我 们 运行 上 面 显示 的 第 二 个 除法 的 例子 。 
Poly . showpair 
(Poly.quorem ([(3,1.0),(2,2.0),(1,73.0),(0,21.0)], 
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[(2,1.0), (1,1.0), (0,72.0)])); 

> "x + 1.0, - 2.0x + 3.0" : string 
利用 gquorem 我 们 可 以 很 简单 地 定义 商 函 数 quo。 加 上 练习 3.45 的 di 函数 ,结构 Poly 就 有 了 满足 
签名 ARITH 的 所 有 组 件 。 我 们 的 算术 结构 现在 包括 了 复数 、 二 进 制 数 、 和 矩 阵 和 多 项 式 ! 但 是 ， 
再 次 提醒 一 下 ， 这 些 结构 有 很 多 重要 的 不 同 点 ， 每 个 都 有 自己 的 附加 组 件 ， 这 些 组 件 对 于 其 
他 结构 是 没 意 义 的 。 虽 然 可 以 做 到 让 Poly 满 足 签名 ARITH， 但 是 通常 我 们 都 会 充分 利用 其 中 
附加 组 件 的 长 处 。 

对 于 多 项 式 的 欧 几 里 得 算法 。 现 在 可 以 利用 欧 几 里 得 算法 来 计算 GCD 了 。 还 记得 吗 ? #2 
是 用 来 提取 序 侦 第 二 个 分 量 的 函数 ， 这 里 用 来 提取 多 项 式 除法 所 产生 的 余 式 。 


fun gcd ([], us) 
| gcd (ts, us) 


us 
gcd (#2(quorem (us,ts)), ts); 


假设 Poly 包 括 了 gcd， 并 将 其 作为 一 个 组 件 ， 我 们 可 以 用 它 来 试验 几 个 例子 。x - 1 和 x - 1 的 
GCD 是 x 一 1: 
Poly.show (Poly.gcd ([(8,1.0),(0,71.0)], 


[(3,1.0),(0,71.0)])); 
> "x - 1.0" : string 


ix? + 2x 二 1 和 x? 一 1 的 GCD 是 ...-2x — 2849 


Poly.show (Poly.gcd ({[(2,1.0),(1,2.0), (0,1.0)], 
[(2,1.0), (0,71.0)])); 
> "~ 2.0x - 2.0" : string 
这 个 GCD 应 该 是 x + 1。 就 这 个 具体 的 困难 来 说 ， 虽 然 可 以 通过 将 所 有 系数 除 以 首 项 系数 来 解 
决 ， 但 是 还 存在 其 他 问题 。 这 些 问 题 令 我 们 想到 必须 使 用 有 理 数 (分 数 ) BA: 见 下 面 的 警 
告 。 那 样 的 话 ， 计 算 GCD 通 常 都 需要 操作 非常 大 的 整数 ， 即 使 是 对 于 仅仅 具有 一 位 数 系数 的 
初始 多 项 式 。 算 法 还 需要 做 很 多 深入 的 提炼 ， 通 常 必须 要 用 到 模 运 算 。 


A 小 心 合 入 误差 。 在 GCD 里 ， 浮 点 数 (RRAN) 的 使 用 显得 非常 糟糕 ， 因 为 它 
的 第 一 行 需要 检测 余 式 是 否 为 堆 。 除 法 中 的 伟人 误差 会 导致 余 式 具有 非常 小 但 又 不 
为 替 的 系数 ， 会 因此 而 错过 公园 式 。 对 于 其 他 应 用 ， 多 项 式 算 术 都 表现 得 很 出 色 ， 
因为 此 时 舍 入 误差 是 可 预测 的 。( 我 要 感谢 James Davenport 关 于 这 方面 的 分 析 。) 


©) 进一步 的 阅读 。Davenport 等 (1993) 做 了 一 个 出 色 的 关于 计算 机 代数 的 介绍 。 
其 中 第 2 章 讲 到 了 数据 表示 。 例 如 ， 我 们 知道 ， 多 元 多 项 式 可 以 表示 为 一 元 多 项 式 ， 
其 中 多 项 式 的 系数 是 关于 其 他 变 元 的 一 元 多 项 式 。 RER, V+ xy 是 关于 y 的 一 元 
多 项 式 ， 它 的 两 个 系数 是 分 别 是 1 和 多 项 式 x; 我 们 也 可 以 交换 x 和 y 的 角色 。 那 本 书 的 
第 4 章 还 讲 到 了 高 效 计算 GCD 所 涉及 的 令 人 生 遇 的 复杂 技术 。 


要 点 小 结 


* 表 是 从 空 表 (nil 或) 开始 建立 的 ， 利 用 :: (“cons”) 将 元 素 连接 在 前 面 。 
* 重要 的 库 函 数 包括 length、take、drop、 中 组 操作 符 & GER) 和 rev (翻转 )。 
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。 通 过 将 它 的 结果 在 另 一 个 参数 中 积累 ， 递 归 函 数 可 以 避免 低 效 的 表 连 接 操作 。 
。 相 等 多 态 性 允许 范 数 对 它 的 参数 进行 相等 测试 。 有 关 的 例子 有 : 测试 元 素 和 表 的 成 员 关 
系 的 mem， 以 及 搜索 序 偶 表 的 函数 assoc。 
121 。 常见 的 排序 算法 可 以 用 表 来 实现 ， 并 具有 出 乎 意料 的 效率 。 | 
122 。 表 可 以 用 来 表示 二 进 制 数 、 和 矩阵 、 图 、 多 项 式 等 ， 这 使 得 操作 和 运算 的 表达 变 得 简洁 。 





第 4 章 树 和 具体 数据 


具体 数据 (concrete data) 是 由 一 些 构造 组 成 的 ， 这 些 构造 可 以 被 检视 、 分 解 或 合并 成 更 
大 的 构造 。 表 就 是 具体 数据 的 一 个 例子 。 我 们 可 以 测试 表 是 否 为 空 ， 也 可 以 将 非 空 表 分 解 成 
表 头 和 表 尾 。 新 的 元 素 也 可 以 加 入 到 表 中 。 这 一 章 将 介绍 几 种 其 他 形式 的 具体 数据 ， 包 括 树 
和 逻辑 命题 。 
ML 的 数据 类 型 (datatype) 声明 可 以 定义 一 个 新 的 类 型 以 及 它 的 构造 子 〈constructor ) 。 
在 表达 式 中 ， 构 造 子 创 建 数据 类 型 的 值 ， 在 模式 中 ， 构 造 子 则 描述 了 如 何 分 解 这 样 的 一 个 值 。 
数据 类 型 可 以 表示 包含 多 个 子 类 的 数据 类 ， 就 像 是 Pascal 中 的 变 体 记录 ， 但 没有 那样 复杂 和 不 
安全 。 递 归 的 数据 类 型 通常 用 来 表示 树 。 作 用 在 数据 类 型 上 的 函数 是 通过 模式 匹配 来 声明 的 。 

特殊 的 数据 类 型 exn 是 异常 (exception) 类 型 ， 代 表 发 生 了 错误 情况 。 错 误 是 可 以 发 出 信 
号 以 及 被 捕捉 的 。 异 常 处 理 也 是 通过 模式 匹配 来 测试 特定 的 错误 的 。 


本 章 提要 


本 章 讲述 了 数据 类 型 、 模 式 匹 配 、 异 常 处 理 和 树 。 包 括 以 下 几 节 : 

。 数 据 类 型 声明 。 通 过 例子 来 说 明 数据 类 型 、 构 造 子 和 模式 匹配 。 为 了 表示 国王 和 他 的 臣 
民 ， 类 型 person (A) 是 由 四 类 个 体 组 成 的 ， 并 且 每 个 个 体 都 有 各 自 关 联 的 适合 信息 。 
。 异 常 。 这 表示 了 一 类 错误 的 值 。 可 以 为 每 个 可 能 的 错误 定义 异常 。 抛 出 异常 代表 发 出 错 
误 信 号 ; 处 理 异 常 则 代表 了 进行 一 个 替代 计算 。 

。 树 。 树 是 一 种 分 支 结 构 。 二 叉 树 是 表 的 一 般 化 ， 它 有 着 非常 多 的 应 用 。 

。 以 树 为 基础 的 数据 结构 。 字 典 、 弹 性 数组 和 优先 队列 很 容易 用 二 又 数 来 实现 。 更 新 操作 
建立 了 新 的 结构 ， 不 过 会 尽量 减少 复制 。 

。 重 言 式 检测 器 。 这 是 最 基本 的 定理 证 明 的 例子 。 其 中 声明 了 关于 命题 (布尔 表达 式 ) 的 
数据 类 型 。 函 数 将 命题 转换 成 合 取 范式 并 进行 重 言 式 测 试 。 


数据 类 型 声明 


一 个 由 不 同 成 分 构成 的 类 包含 了 多 个 不 同 的 子 类 。 圆 、 三 角形 和 正方 形 都 是 几何 形状 ， 
但 种 类 却 不 同 。 三 角形 可 以 用 三 个 点 来 表示 ， 正 方形 用 四 个 点 来 表示 ， 而 圆 要 用 圆心 和 半径 
来 表示 。 

我 们 来 个 难 一 点 的 问题 ， 考 虑 将 不 列 颠 王国 的 居民 按 他 们 的 级 别 来 分 类 。 这 包括 了 国王 
(King)、 贵 族 (Peer), t (Knight) 和 农民 (Peasant)。 对 于 每 一 种 人 都 要 记录 相应 的 信息 : 

。 国王 就 是 国王 ， 没 什么 需要 多 说 的 。 

。 贵 族 拥 有 爵位 、 封 地 和 第 几 代 。 

。 骑 士 和 农民 都 有 名 字 。 

在 弱 类 型 语言 中 ， 可 以 直接 表达 这 些 子 类 。 我 们 只 要 小 心 区 分 骑士 和 农民 ; 其 他 的 自然 有 所 
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区 别 。 在 ML 里 可 以 这 样 试 试 


"King" 

("Earl","Carlisle",7) ("Duke", "Norfolk",9) 
("Knight", "Gawain") ("Knight", "Galahad" ) 
("Peasant", "Jack Cade") ("Peasant", "Wat Tyler") 


不 幸 的 是 ， 它 们 并 不 具有 相同 的 类 型 ! 基于 这 种 表示 ， 没 有 任何 一 个 ML 国 数 可 以 同时 处 理 国 
王 和 农民 。 


4.1 国王 和 他 的 臣民 
一 个 包含 有 国王 、 贵 族 、 骑 士 和 农民 的 ML 类 型 可 以 通过 数据 类 型 (datatype) 声明 来 创建 : 


datatype person = King 
| Peer of string*string* int 
| Knight of string 
| Peasant of string; 

> datatype person 


> con King : person 

> con Peer : string * string * int -> person 
> con Knight : string -> person 

> 


con Peasant : string -> person 


上 面 声 明了 五 样 东西 ， 分 别 叫 作 类 型 person 和 它 的 四 个 构造 子 (constructor) King, Peer, 
Knight#\Peasant. 

类 型 person 包 含 且 仅 包含 了 由 它 的 构造 子 所 构造 的 值 。 注 意 ，King 具 有 类 型 person， 而 其 
他 的 构造 子 则 如 同 函数 那样 返回 属于 此 类 型 的 东西 。 这 样 ， 下 面 的 值 都 具有 类 型 person: 


King 

Peer("Earl","Carlisle",7) Peer ("Duke", "Norfolk",9) 
Knight "Gawain" Knight "Galahad" 

Peasant "Jack Cade" Peasant “Wat Tyler" 


进一步 来 说 ， 这 些 值 都 是 不 同 的 。 没 有 人 可 以 既是 骑士 又 是 农民 ; 也 没有 贵族 可 以 有 两 个 不 
Vea] YS BF az 


类 型 Persom 的 值 就 像 其 他 ML 的 值 那样 ， 可 以 是 函数 的 参数 和 返回 值 ， 并 且 可 以 嵌 在 其 他 
的 数据 结构 中 ， 比 如 表 : 


val persons = [King, Peasant "Jack Cade", Knight "Gawain"]; 
> val persons = [King, Peasant "Jack Cade", 
> Knight "Gawain"] : person list 


由 于 每 个 person 都 是 一 个 单一 的 构造 ， 所 以 它 可 以 被 分 解 。 作 用 在 数据 类 型 之 上 的 函数 可 以 
通过 包含 构造 子 的 模式 来 声明 。 就 像 处 理 表 那样 ， 可 以 分 为 几 种 情形 。 对 一 个 人 的 称呼 是 根 
据 他 的 级 别 来 确定 的 ， 在 构造 称呼 的 时 候 使 用 了 字符 串 连 接 操作 〈^): 


fun title King "His Majesty the King" 


| title (Peer (deg,terr,_)) "The " ^ deg ^" of " ^ terr 
| title (Knight name) "Sir " ^ name 
| title (Peasant name) = name; 

> val title = fn : person -> string 


每 个 情形 都 由 一 个 模式 以 及 这 个 模式 自 有 的 变量 来 确定 。 在 Knight 和 Peasant 这 两 个 情形 中 都 


it th ou 
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涉及 变量 名 name， 但 是 它们 分 属 不 同 的 作用 域 。 


title (Peer("Earl", "Carlisle", 7)); 
> "The Earl of Carlisle" : string 
title (Knight "Galahad") ; 

> "Sir Galahad" : string 


必要 时 ， 模 式 可 以 非常 复杂 ， 将 元 组 、 表 构造 子 和 数据 类 型 构造 子 组 合 在 一 起 。 函 数 sirs 返 回 
persoms 表 中 所 有 骑士 的 名 字 : 


fun sirs [] = [} 
| sirs ( (Knight s) :: ps) = s :: (sirs ps) 
| sirs (p :: ps) = sirs ps; 


> val sirs = fn : person list -> string list 

sirs persons; 

> ["Gawain"] : string list 
函数 中 的 分 情 处 理 是 按照 情形 的 顺序 来 进行 的 。 第 三 个 情形 (具有 模式 p: :ps) Ep Knight 
的 时 候 并 不 会 被 考虑 ， 因 此 ， 不 能 将 它 从 上 文中 去 掉 。 有 些 人 倾向 于 使 各 个 情形 互 不 相交 ， 
以 助 于 数学 上 的 论证 。 但 是 这 样 一 来 ， 就 需要 将 情形 p::ps 替 换 成 分 开 的 King、Peer 和 Peasant， 
使 程序 变 得 更 长 、 更 慢 和 更 不 易 读 。sirs 的 第 三 个 情形 作为 一 个 条 件 等 式 是 非常 合理 的 ， 它 对 
TIA PEE Knight HI pRB ERL 

在 两 个 人 进行 等 级 比较 的 时 候 ， 情 形 的 顺序 就 更 加 重要 了 。 与 其 测试 所 有 的 16 种 情形 ， 
我 们 不 如 仅仅 测试 那些 返回 为 frue 的 情形 ， 而 对 于 剩 下 的 情形 返回 false， 这 样 的 话 ， 总 共 只 有 - 
7 种 情形 。 注 意 ， 通 配 符 在 模式 中 的 使 用 是 很 频繁 的 。 


fun superior (King, Peer _) = true 
| superior (King, Knight _) = true 
| superior (King, Peasant _) = true 
| superior (Peer _, Knight _) = true 
| superior (Peer _, Peasant _) = true 
| superior (Knight _, Peasant _) = true 
| superior _ = false; 


> val superior = fn : person * person -> bool 


练习 4.1 ”书写 一 个 ML 函数 将 人 映射 到 整数 ， 将 国王 对 应 为 4， 贵 族 对 应 为 3， 骑 士 对 应 成 2 
以 及 农民 对 应 成 1。 书 写 一 个 与 superior 等 价 的 函数 、 通 过 对 相应 映射 结果 的 比较 来 完成 等 级 
比较 。 


练习 4.2 ”修改 类 型 person， 加 入 构造 子 Esquire (乡绅 ) ， 他 的 参数 是 名 字 和 所 在 的 村 庄 (都 
使 用 字符 串 表 示 )。 这 个 构造 子 的 类 型 是 什么 ? 修改 函数 title 以 产生 类 似 


“John Smith, Esq., of Bottisham" 
的 称呼 。 修 改 函 数 superior 将 Esquire 排 在 Knight 和 Peasant 之 间 。 


练习 4.3 ”声明 一 个 关于 几何 图 形 的 数据 类 型 ， 例 如 三 角形 、 长 方形 、 直 线 和 圆 。 声 明 一 个 计 
算 图 形 面积 的 函数 。 


4.2 枚 举 类 型 
用 字符 串 来 表示 贵族 的 爵位 可 能 是 不 可 取 的 。 这 样 无 法 防止 假 的 爵位 ， 比 如 “butcher” 
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(CER) MM “madman” (MF). MMA RTA Ra iL; 我 们 将 它们 声明 为 新 数据 类 型 的 构 
造 子 : 
datatype degree = Duke | Marquis | Earl | Viscount | Baron; 
(* 2B. RR. (AR. TEMBR *) 
现在 需要 重新 声明 类 型 person， 使 得 构造 子 Peer 具 有 类 型 


degree x string x int person 


对 于 类 型 degree 的 函数 也 是 通过 分 情 来 处 理 。 我 们 看 看 上 流 社会 女性 的 称呼 是 怎样 的 ? 


fun lady Duke = "Duchess" 
| lady Marquis = "Marchioness" 
| lady Earl = "Countess" 
| lady Viscount = “Viscountess" 
| lady Baron = "Baroness"; 


> val lady = fn : degree -> string 


准确 的 称呼 在 法 庭 和 社交 专栏 上 是 至 关 重 要 的 ， 但 在 电子 出 版 方面 ， 这 个 例子 的 重要 性 就 不 
那么 明显 了 。 

像 degree 这 样 由 有 限 数 目的 常量 组 成 的 类 型 称 为 枚 举 类 型 (enumeration type)。 另 外 一 个 
例子 就 是 内 置 的 bool 类 型 ， 它 是 这 样 声明 的 

datatype bool = false | true; 
函数 not 是 通过 分 情 来 声明 的 


fun not true = false 
| not false = true; 


标准 库 声明 了 枚 举 类 型 order (顺序 ) ， 如 下 : 


datatype order = LESS | EQUAL | GREATER; 


这 涵盖 了 比较 的 三 种 可 能 结果 。 程 序 库 的 字符 串 、 整 数 、 实 数 、 时 间 、 日 期 等 的 结构 都 各 自 
包括 了 一 个 比较 函数 compare， 此 函数 将 返回 这 三 种 结果 中 的 一 个 : 


String .compare ("York", “Lancaster"); 
> GREATER : order 


我 们 对 于 返回 布尔 值 的 关系 操作 可 能 更 为 熟悉 。 但 是 需要 调用 两 次 < 来 取得 一 次 
String .compare 调 用 所 能 返回 的 信息 。 第 一 个 Fortran 版 本 就 提供 了 返回 三 种 结果 的 比较 操作 ! 
在 计算 机 技术 的 不 断 演变 中 ， 它 们 一 直 维 持原 状 …… 


A 小 必 数 据 类 型 的 重 定义 。 每 个 数据 类 型 声明 都会 创建 一 个 与 其 他 类 型 都 不 同 的 
新 类 型 。 假 设 我 们 已 经 定义 了 类 型 degree 和 函数 Jady。 现 在 ， 重 复 声明 一 次 de8gree， 
这 会 声明 全 新 的 类 型 和 构造 子 。 斌 图 对 1ady(Duke) 求 值 会 得 到 类 型 错误 “期 望 类 型 
degree， 但 遇 到 类 型 degree。” 两 个 不 同 的 类 型 现在 都 叫 degree。 这 种 邻 人 恼火 的 情形 
可 能 出 现在 交互 式 修改 程序 的 过 程 中 。 最 彻底 的 补救 方法 是 终止 当前 的 ML 会 话 ， 启 
动 一 个 新 的 会 话 ， 然 后 重新 调 入 程序 。 


练习 4.4 ”声明 一 个 枚 举 类 型 ， 由 6 个 不 同 的 国家 名 组 成 。 书 写 一 个 函数 将 每 个 国家 的 首都 名 
字 作为 字符 串 返 回 。 





HEREKE 97 


练习 4.5 ”书写 类 型 为 bool x bool- bool 的 函数 ,实现 布尔 的 合 取 和 析 取 。 使 用 模式 匹配 ， 而 
不 是 andalso、orelse 或 者 if。 这 需要 显 式 地 测试 多 少 种 情形 ? 


4.3 多 态 数 据 类 型 


回想 一 下 list 是 具有 一 个 参数 的 类 型 操作 符 。。 由 此 可 知 ，list 就 不 是 一 种 类 型 ， 而 (int) list 
和 ((string x real) list) list 却 是 类 型 。 数 据 类 型 声明 可 以 引入 新 的 类 型 操作 符 。 
“可 选 ” 类 型 。 标 准 库 定义 了 类 型 操作 符 option: 


datatype ‘a option = NONE | SOME of ‘a; 
> datatype ‘a option 

> con NONE : ‘a option 

> con SOME : ‘a -> ‘a option 


类 型 操作 符 option 有 一 个 参数 。 类 型 + option 包 括 了 类 型 的 一 个 副本 ， 并 增加 了 额外 的 一 个 值 
NONE。 它 可 以 用 来 向 函数 提供 可 选 的 参数 ， 但 是 最 明显 的 用 途 还 是 指示 错误 。 例 如 ， 库 函数 
Real.HjromStrin8 将 字符 串 参 数 转换 成 实数 ， 但 是 它 不 能 接受 表示 60 000 的 所 有 表达 方式 : 


Real .fromString "6.0E5"; 

> SOME 60000.0 : real option 

Real.fromString "full three score thousand"; . 
> NONE : real option 


可 以 使 用 case 表 达 式 来 分 情 处 理 返 回 的 结果 ， 见 下 面 4.4 节 。 
不 相交 和 类 型 。 这 是 一 个 基本 的 操作 符 ， 构 成 两 个 类 型 的 不 相交 和 (disjoint sum) 或 联 
(union): 
datatype (‘a,’b)sum = Inl of 'a | In2 of ’b; 
类 型 操作 符 swm 有 两 个 参数 。 它 的 构造 子 分 别 是 
Inl : a — (æ, B)sum 
In2 : B — (a, B)sum 
类 型 (og, T) sum 是 类 型 o 和 的 不 相交 和 。 如 果 x 属 于 类 型 9， 它 的 值 形 如 In1(x)， 或 者 如 果 y 属 于 
类 型 r， 它 的 值 则 形 如 In2(y)。 这 个 类 型 含有 oa 和 的 副本 。 可 以 观察 到 ，In1l 和 1n2 可 以 被 看 作 
是 区 分 c 和 z 的 标签 。 
不 相交 和 允许 在 通常 只 能 出 现 一 个 类 型 的 场合 里 放 上 多 个 类 型 。 表 的 元 素 必 须 具 有 相同 
的 类 型 ， 如 果 这 个 元 素 类 型 是 (string, person) su， 那么 元 素 就 可 以 是 字符 串 或 者 是 “人 “， 
而 类 型 (string, int) sum 则 包括 了 字符 串 和 整数 。 


[In2(King), Inl("Scotland")] : ((string, person)sum)list 
[nl ("tyrant"), in2(1040)] : ((string, int)sum)list 


不 相交 和 的 模式 匹配 可 以 测试 出 元 素 是 存在 于 In1 中 还 是 存在 于 1n2 中 的 。 函 数 concat1 将 表 中 
所 有 In1 中 的 字符 串 连 接 起 来 : 


O ”正确 的 名 称 是 类 型 构造 子 (type constructor) (Milner 等 ，1990)。 我 在 这 里 避免 使 用 这 个 名 称 是 为 了 不 造 
成 它 和 数据 类 型 的 构造 子 之 间 的 混淆 。 
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fun concatl [) 
| concatl ( (nl s)::1) = s ^ concatl l 
| concath ( (m2 _)::1) concat) l; 
> val concati = fn : (string, ʻa) sum list -> string 
concath [ Ini "oi", m2 (1040,1057), mi “Scotland” Jj; 
> "O! Scotland" : string 
表达 式 1In1“Scotland” 已 经 出 现在 两 种 类 型 中 了 ， 也 就 是 (string, int x int)sum 和 (string， 
person) sum。 这 是 可 能 的 ， 因 为 这 个 表达 式 的 类 型 是 多 态 的 : 
Int “Scotland"; 
> Inl "Scotland" : (string, ‘a) sum 
表达 其 他 的 数据 类 型 。 不 相交 和 可 以 表达 所 有 的 非 递归 数据 类 型 。 类 型 person 可 以 表示 为 
((unit, string x string x int)sum, (string, string)sum)sum 


面 原来 的 构造 子 映射 为 


a 


nou ow 


King = Inl (In1 0) 
Peer(d, t, n) = In\(In2(d, t, n)) 
Knight(s) = In2(in1(s)) 
Peasant(s) = In2(in2(s)) 
这 些 既 可 以 作为 表达 式 也 可 以 作为 模式 。 不 用 说 ， 类 型 person 更 好 看 一 些 。 注 意 观 察 唯一 的 
国王 是 怎样 通过 只 有 一 个 值 0 的 类 型 unit 来 表示 的 。 


i) 空间 的 需求 。 数 据 类 型 需要 令 人 吃惊 的 大 量 空间 ， 至 少 现在 的 编译 器 是 这 样 的 。 
典型 的 值 需 要 4 字 节 的 标记 (来 标识 构造 子 )， 相 关 元 组 的 每 个 分 量 各 需要 4 字 节 ( 指 
针 )。 垃 圾 收集 器 需要 一 个 头 ， 又 占 去 了 4 字 节 。 结 果 对 于 Knight 和 Peasant 总 共 各 需 
要 12 字 节 ， 而 Peer 则 需要 20 个 字 节 。 这 里 会 直接 将 整数 存放 在 Peer 里 面 ， 而 字符 事 
则 需要 作为 单独 的 对 象 另 外 存放 。 

枚 举 类 型 的 内 部 值 需 要 的 空间 不 会 比 整 数 更 多 ， 尤 其 是 在 那些 允许 无 限 精度 整 
数 的 ML 系统 中 。 表 元 素 一 般 占 用 8 ~ 12 个 字 节 。 如 果 使 用 一 个 过 时 的 垃圾 收集 器 ， 
一 个 对 象 所 占用 的 空间 还 可 能 随 着 对 象 的 生存 时 间 而 变化 ! 

也 有 可 能 做 出 优化 。 如 果 一 个 数据 类 型 只 有 一 个 构造 子 、 那 么 就 没有 必要 存储 
标记 。 如 果 只 有 一 个 构造 子 不 是 常量 ， 那 么 这 个 构造 子 可 能 也 不 需要 标记 ; 这 对 于 
表 是 可 以 的 ， 但 对 于 可 选 类 型 就 不 行 ， 因 为 SOME 的 参数 可 以 是 任何 东西 。9 和 Lisp 
比较 ， 运行 时 没有 类 型 是 可 以 节省 一 些 空间 的 。Appel (1992) 讨论 了 这 方面 的 问题 。 
随 着 运行 时 系统 的 改进 ， 我 们 可 以 期 望 对 于 空间 的 需求 还 会 适当 减 小 。 


练习 4.6 ”如 上 定义 的 King、Peer、Knight 和 Peasant 都 是 什么 类 型 ? 


练习 4.7 展示 类 型 (o, 1) sum 的 值 和 类 型 (a list) x (Tt list) AE 
的 对 应 关系 。 





形 如 ([x], (DRO, LD), 


O 这 里 的 意思 大 概 是 指针 值 和 小 整数 是 可 以 区 分 的 ， 如 果 构 造 子 的 参数 包含 有 对 于 其 他 对 象 的 引用 指针)， 
那么 这 个 构造 子 通过 指针 值 就 可 以 和 其 他 常量 构造 子 区 分 开 来 。 一 一 译 者 注 
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4.4 通过 val、as、case 进 行 模式 匹配 


模式 (pattern) 是 一 个 只 包含 变量 、 构 造 子 和 通配符 的 表达 式 。 构 造 子 包括 

* 数 、 字 符 和 字符 串 常量 

。 序 偶 、 元 组 和 记录 结构 

。 表 和 数据 类 型 的 构造 子 
在 模式 中 ， 所 有 不 是 构造 子 的 名 字 都 是 变量 。 任 何 它们 在 模式 之 外 可 能 拥有 的 意思 都 无 效 了 。 
模式 中 的 变量 必须 彼此 不 同 。 这 些 条 件 保证 了 值 可 以 有 效 地 和 模式 进行 匹配 ， 并 且 以 唯一 的 
方式 通过 分 析 绑 定 到 变量 上 去 。 

构造 子 必须 绝对 和 变量 区 分 开 来 。 在 本 书 中 ， 构 造 子 以 大 写字 母 开 头 ， 而 大 多 数 变量 则 
以 小 写字 母 开头 。* 但 是 ， 标 准 的 构造 子 nil、true 和 false 仍 旧 以 小 写字 母 开头 。 构 造 子 的 名 字 
可 以 是 符号 的 ， 也 可 以 是 中 缓 的， 例如 表 的 构造 子 : : 。 标 准 库 喜 欢 将 构造 子 命名 为 全 大 写字 
母 ， 就 像 NONE。 

A 模式 匹配 中 的 错误 .模式 中 的 拼写 错误 是 很 难 发 现 的。 下 面 版 本 的 函数 1itle 合 有 

几 个 错误 ， 试 着 把 它们 找 出 来 ， 然 后 再 往 下 读 : 


fun title Kong "His Majesty the King" 


| title (Peer(deg,terr,_)) = "The " ^ deg “~ " of " ^ terr 
| title (Knightname) = "Sir "* name 
| title Peasant name = name; 


第 一 个 错误 是 把 构造 子 King 错 拼 成 Kong 了。 这 就 变 成 了 一 个 变量 ， 而 且 匹 配 所 有 的 
值 ， 它 阻止 了 继续 对 其 他 情形 的 考虑 。 当 函数 有 宛 余 的 情形 时 ，ML 编 译 器 会 给 出 警 
告 ， 对 这 个 敬告 必须 留意 1 

第 二 个 错误 是 Knightname: 漏 掉 一 个 空格 再 次 将 构造 子 变 为 了 变量 。 由 于 这 个 
错误 使 得 name 成 了 未 定义 的 变量 ， 因 此 编译 器 会 报错 。 

第 三 个 错误 是 漏 掉 了 Peasant name 外 面 的 括号 ， 所 得 出 的 错误 信息 有 可 能 让 人 英 
名 其 妙 。 

拼写 错误 的 构造 子 函 数 ( 带 参数 的 构造 子 ) 会 被 立即 检测 出 来 ， 因 为 
fun f (g x) =... 
只 有 在 8 是 构造 子 的 情况 下 才 是 允许 的 。 其 他 的 拼写 错误 可 能 不 会 引起 任何 警告 。 漏 
掉 通 配 符 前 面 的 空格 ， 比 如 Peer _ ， 这 种 错误 是 特别 隐藏 的 。 


练习 4.8 ”在 superior 中 犯 什么 样 的 简单 错误 会 只 改变 函数 的 行为 而 又 不 会 引起 元 余 情 形 ? 
值 声明 中 的 模式 。 声 明 


val P= E 
定义 了 模式 P 中 的 变量 ， 并 赋予 它们 表达 式 E 中 相应 的 值 。 我 们 曾经 在 第 2 章 使 用 这 一 方法 来 选 
择 元 组 中 的 分 量 : wi 
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val (xc,yc) = scalevec(4.0, a); 
> val xc = 6.0: real 
> val yc = 27.2 : real 


我 们 也 可 以 书写 
val [x,y,z] = upto(1,3); 
> val x = 1: int 


> val y=2: int 
> val z= 3: int 


如 果 表 达 式 的 值 与 模式 不 匹配 的 话 ， 声 明 就 会 失败 〈 抛 出 一 个 异常 )。 当 模式 是 元 组 的 时 候 ， 
类 型 检测 可 以 避免 这 样 的 异常 。 

下 面 的 声明 是 有 效 的 : 表达 式 的 值 与 它们 的 模式 匹配 ， 却 没有 声明 任何 值 。 

val King = King; 

val [1,2,3] = upto(1,3); 
构造 子 的 名 字 不 能 用 val 声 明 来 改变 它 的 用 途 。 在 类 型 person 的 作用 域内 ， 名 字 King、Peer、 
Knight 和 Peasant 都 被 保留 作 构 造 子 。 像 下 面 这 样 的 声明 会 被 认为 是 试图 做 模式 匹配 ， 并 会 被 
拒绝 而 得 到 类 型 错误 的 信息 : 


val King = “Henry V"; 

val Peer = 925; 

多 层 模式 (layered pattern ) 。 模 式 中 的 变量 还 可 以 是 下 面 的 形式 
Id as P 


如 果 整 个 模式 〈P 是 其 中 的 一 部 分 ) 匹配 的 话 ， 那 么 和 P 匹 配 的 值 也 会 被 绑 定 到 标识 符 l4 上 。 这 
个 值 既 可 以 通过 模式 来 看 ， 也 可 以 通过 整体 来 看 。 函 数 nextrun (出 自 3.21 节 ) 可 以 这 样 编写 
fun nextrun(run, []) 
| nextrun(run as r::_, X::xS) 


if x < r then (rev run, x: :xs) 
else nextrun(x::run, XS); 


这 里 run 和 r::_ 是 同一 个 表 。 现 在 可 以 通过 r 来 引用 表 头 而 不 需要 hd run 了 。 这 种 写法 是 否 比 
前 一 个 版 本 更 易 读 是 存在 争议 的 。 

分 情 (case) 表达 式 。 这 是 模式 匹配 的 另 一 个 载体 ， 它 的 形式 是 

case E of P, => Ey | © | Ph => En 


E 的 值 顺序 地 和 模式 Pi, .…, P, 进 行 匹配 ， 如 果 P; 是 第 一 个 匹配 的 模式 ， 那 么 E: 的 值 就 是 整个 表 
达 式 的 结果 。 因 此 ， 如 果 根 据 这 些 分 情 定义 一 个 函数 ， 并 把 该 函数 应 用 在 E 上 面 ， 那 么 这 个 函 
数 表达 式 将 和 分 情 表达 式 等 价 。 通 常 的 分 情 表达 式 都 是 测试 几 种 显 式 的 值 ， 然 后 以 一 个 通 配 
的 情形 结束 : 

case p-q of 
"zero" 
"one" 
"two" 
if n < 10 then "lots" else "lots and lots" 


函数 merge (同样 出 自 3.21 节 ) 可 以 重新 利用 case 编 码 ， 先 测试 第 一 个 参数 然后 再 测试 第 二 
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个 参数 : 


fun merge (xlist, ylist) : real list = 
case xlist of 
[] => ylist 
| x::xs => (case ylist of 
{] => xlist 
| y::ys => if x<=y then x::merge(xs, ylist) 
else y::merge (xlist, ys)}; 


在 递归 调用 中 xlist#x: :xs 表示 同一 个 表 ， 这 个 效果 也 可 以 通过 模式 xlist as x: :xs 得 到 。 


A case 的 作用 域 。 没 有 专门 的 符号 来 结束 一 个 分 情 语 句 ， 因 此 ， 如 果 你 不 能 肯定 
语句 没有 歧义 ， 则 应 用 括号 把 整个 语句 括 起 来 。 下 面 ， 虽 然 看 起 来 程序 员 是 要 把 第 
二 行 归 于 外 面 的 分 情 语 辐 ， 但 是 它 却 是 里 面 分 情 语 身 的 一 部 分 : 


case x of 1 => case y of 0 => true | 1 => false 
| 2 => true; 


下 面 的 声明 在 语法 上 并 没有 歧义 ， 但 是 很 多 ML 编译 器 都 不 能 正确 地 进行 分 析 。 分 情 
语 身 需要 用 括号 括 起 来 : 


fun f [x] = case g x of 0 => true | 1 => false 
| f xs = true; 


练习 4.9 ”利用 分 情 语句 来 区 分 类 型 person 的 四 个 构造 子 ， 以 这 种 方式 来 表达 函数 title。 


练习 4.10 ”叙述 一 种 简单 的 方法 将 所 有 的 分 情 语句 从 程序 中 去 掉 。 解 释 一 下 为 什么 你 的 方法 
不 会 改变 程序 的 意思 。 


异常 


一 个 困难 的 问题 可 能 需要 多 种 方法 来 解决 ， 而 每 一 种 方法 只 可 以 成 功 地 处 理 其 中 的 部 分 
情形 。 除 了 实际 试 一 试 某 种 方法 是 否 成 功 以 外 ， 可 能 没有 更 好 的 办 法 来 选择 方法 。 如 果 计 算 
走 进 了 死胡同 ， 那 么 这 个 方法 就 失败 了 ， 或 者 得 出 这 个 问题 是 不 可 能 解决 的 结论 。 某 个 证 明 
方法 可 能 是 毫 无 进展 的 ， 也 可 能 把 它 的 证 明 目 标 简化 成 了 0 = 1。 某 个 数值 的 算法 可 能 会 遭遇 
到 溢出 或 除数 为 零 的 错误 。 

这 些 结果 可 以 表示 为 一 个 数据 类 型 ， 这 个 类 型 的 值 是 Success(s) (成功 )， 其 中 s 是 一 个 解 、 
Failure (失败 ) 和 lImpossible (不 可 能 或 无 解 )。 处 理 多 种 返回 结果 是 复杂 的 ， 就 像 我 们 在 
3.17 节 的 拓扑 排序 函数 里 看 到 的 那样 。 返 回 成 功 和 失败 的 信息 的 函数 cyclesort 要 比 pathsort 复 
杂 ， 后 者 通过 调用 ha [] 来 表达 失败 。( 非常 难看 | ) 

ML 通过 异常 (exception) 来 处 理 失败 。 在 发 现 失败 的 地 方 抛 出 〈raise) 异常， 并 在 其 他 
地 方 处 理 (handle)， 有 可 能 是 在 距离 很 远 的 地 方 。 


45 异常 初步 


异常 是 错误 值 的 数据 类 型 ， 为 了 减少 显 式 的 测试 ， 对 异常 进行 了 特别 的 处 理 。 当 异常 被 
抛 出 时 ， 会 被 所 有 的 ML 函数 传递 ， 直 到 某 个 异常 处 理 器 (exception handler) RIC. RE 
处 理 器 基本 上 就 是 一 个 分 情 表达 式 ， 它 描述 了 对 于 每 一 种 异常 的 返回 值 。 
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假设 函数 method4 和 methodB 用 不 同 的 方法 来 解 题 ， 并 且 show 将 解 显示 成 字符 串 。 使 用 数 
据 类 型 和 它 的 构造 子 Success、Failure 和 Impossible， 可 以 通过 幅 套 的 分 情 语 句 来 尝试 解 题 并 显 
示 其 结果 。 如 果 method4 失 败 了 ， 那 么 就 试 试 merhodB， 车 两 个 都 失败 了 的 话 ， 则 计算 结束 。 
对 于 所 有 的 情况 ， 结 果 都 是 同一 个 类 型 : string。 
case methodA (problem) of 
Success s => show s 
| Failure => (case methodB(problem) of 
Success s => show s 
| Failure => “Both methods failed" 


| Impossible => "No solution exists") 
| Impossible => "No solution exists" 


现在 来 试 试 异常 处 理 。 声 明 异 常 Failure 和 lmpossible 来 代替 可 能 出 现 的 结果 的 数据 类 型 : 


exception Failure; 
exception Impossible; 


函数 methodA 和 methodB， 以 及 任何 它们 所 调用 的 函数 ， 只 要 在 上 面 异 常 声明 的 作用 域内 ， 都 
可 以 通过 类 似 下 面 的 代码 发 出 错误 信号 
if ... then raise Impossible 


else if ... then raise Failure 


else (* 计算 成 功 的 结果 *) 
对 于 methodA 和 methodB 的 调用 尝试 涉及 到 两 个 异常 处 理 器 : 


show (methodA (problem) 
handle Failure => methodB (problem) ) 
handle Failure => "Both methods failed" 
| Impossible => "No solution exists" 


第 一 个 处 理 器 从 methodA 中 捕获 Failure ， 然 后 尝试 methodB。 第 二 个 处 理 器 从 methodB 中 捕获 
Failure 并 从 两 个 方法 中 捕获 1mpossible。 如 果 methodA4 成 功 的 话 ， 销 数 show 被 给 予 method4 的 
结果 ， 否 则 就 是 methodB 的 结果 。 

即使 在 这 样 简单 的 例子 中 ， 使 用 异常 也 能 得 到 较 短 、 较 清晰 和 较 快 的 程序 。 错 误 信息 的 
传播 并 没有 使 程序 变 得 混乱 。 


4.6 声明 异常 


异常 的 名 字 在 Standard ML 里 面 是 内 置 类 型 exn 的 构造 子 。 该 数据 类 型 有 一 个 独特 的 性 质 : 
它 的 构造 子 集合 可 以 被 扩展 。 异 常 声 明 


exception Failure; 


使 得 Failure 成 为 类 型 exn 的 一 个 新 构造 子 。 
虽然 Failure 和 lmpossible 都 是 常量 ， 但 是 构造 子 也 可 以 是 函数 : 


exception Failedbecause of string; 
exception Badvalue of int; 


构造 子 Failedbecause (表示 错误 原因 ) 具有 类 型 string 一 ex， 而 Badvalxe (表示 无 效 值 ) 具有 
类 型 int 一 exn。 它 们 可 以 创建 异常 Failedbecause(msg)，msg 是 供 显 示 用 的 错误 信息 ， 以 及 异常 
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Badvalue(k)， 而 整数 k 可 以 用 来 决定 下 面 接 着 要 尝试 哪个 方法 。 
异常 可 以 通过 let 在 局 部 声明 ， 巷 至 可 以 在 一 个 递归 函数 的 内 部 声明 。 这 会 造成 不 同 的 
异常 具有 相同 的 名 字 以 及 其 他 的 复杂 情况 。 在 可 能 的 情况 下 ， 尽 量 将 异常 声明 在 顶层 。 顶 层 
的 异常 必须 是 单 态 的 。” 
类 型 exn 的 值 可 以 存放 在 表 里 ， 也 可 以 作为 函数 的 返回 值 ， 等 等 ， 就 像 其 他 类 型 的 值 一 样 。 
另外 ， 它 们 在 raise 和 handle 的 操作 中 扮演 了 特殊 的 角色 。 


Ol 动态 类 型 和 exn。 由 于 类 型 ern 可 以 通过 增加 构造 子 来 进行 扩展 ， 所 以 它 可 以 暗 
含 任意 类 型 的 值 。 于 是 ， 我 们 得 到 了 一 种 弱 形式 的 动态 类 型 机 制 。 这 是 ML 的 一 个 附 
带 特性 ; CAML 则 是 用 更 成 熟 的 方式 来 处 理 动态 (Leroy 和 Mauny，1993)。 

例如 ， 假 设 我 们 希望 提供 一 种 统一 的 接口 来 将 任意 数据 表示 成 字符 囊 。 所 有 的 
转换 函数 都 可 以 具有 类 型 exm 一 siring。 如 果 想 将 这 个 系统 扩展 到 一 个 新 的 类 型 上 ， 此 
如 说 Complex.1， 我 们 为 这 个 类 型 定义 了 新 的 异常 ， 并 书写 类 型 为 exn 一 string 的 新 转 
Rw RK: 
exception ComplexToString of Complex.t; 
fun convert.complex (ComplexToString z) = ... 


只 有 当 这 个 函数 应 用 于 构造 子 Complex7pString 的 时 候 ， 才 是 有 用 的 。 一 组 类 似 的 函 
数 可 以 被 存储 在 字典 里 面 ， 通 过 统一 的 键 值 ， 例 如 字符 囊 ， 来 标识 。 这 样 ， 就 有 了 
面向 对 象 程序 设计 的 基本 形式 。 


47 抛 出 异常 


异常 的 抛 出 会 建立 一 个 异常 包 (exception packet)， 里 面包 括 了 类 型 exn 的 一 个 值 。 如 果 
Ex 是 类 型 为 exn 的 表达 式 ， 并 且 计 算 Ex 得 到 值 ， 那 么 

raise Ex 
则 会 计算 得 出 一 个 包含 值 e 的 异常 包 。 异 常 包 并 不 是 ML 的 值 ， 能 识别 它们 的 只 有 raise 和 
handle 操 作 。 因 此 ， 类 型 exn 起 到 了 协调 异常 包 和 ML 值 的 作用 。 

在 计算 过 程 中 ， 异 常 包 的 传播 遵循 传 值 调用 的 原则 。 如 果 表 达 式 E 返 回 一 个 异常 包 ， 那 么 
对 于 任意 函数 /， 涌 数 应 用 fE) 的 结果 也 是 这 个 异常 包 。 因 此 ,f(raise Ex) 和 raise Ex 等 价 。 
男 外，raise 本 身 也 传播 异常 ， 所 以 

raise (Badvalue (raise Failure)) 

抛 出 异常 Failure。 

在 ML 中 ,表达 式 是 从 左 到 右 计算 的 。 如 果 已 返回 异常 包 ,， 那 么 这 也 是 序 偶 (E:, E,) 的 结果 ， 
表达 式 已 根本 不 进行 求 值 。 如 果 忆 返回 一 个 正常 值 而 已 返 回 异 常 包 ， 那 么 该 异常 包 就 是 序 偶 
的 值 。 当 已 和 已 抛 出 不 同 的 异常 时 ， 结 果 就 和 求 值 的 顺序 有 关 了 。 

求 值 的 顺序 在 条 件 表 达 式 中 也 可 以 察觉 : 

if E then E; else E 


O 这 个 限制 和 命令 式 的 多 态 性 有 关 ; 见 8.3 节 。 
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式 的 值 。 类 似 地 ， 如 果 E 的 计算 结果 是 false ， 那 么 只 有 会 被 求 值 。 还 有 第 三 种 可 能 性 ， 如 果 
测试 E 抛 出 一 个 异常 ， 那 么 它 就 成 为 了 条 件 表达 式 的 结果 。 

最 后 ， 考 虑 let 表 达 式 

let val P = E in E end 


如 果 已 的 计算 结果 是 异常 包 的 话 ， 那 么 整个 let 表达 式 的 结果 也 是 。 

异常 包 并 不 是 通过 测试 来 进行 传播 的 。ML 系 统 可 以 高 效 地 跳 转 到 正确 的 异常 处 理 器 ， 如 
果 没 有 这 样 的 异常 处 理 器 ， 运 行 就 要 终止 了 。 

标准 异常 。 失 败 的 模式 匹配 可 能 会 抛 出 内 置 的 异常 Match 或 者 Bind。 函 数 在 被 应 用 到 和 它 
的 所 有 模式 都 不 匹配 的 参数 上 时 则 抛 出 异常 Match。 当 分 情 表达 式 没 有 匹配 的 模式 时 ， 也 会 抛 
出 异常 Match。ML 遇 到 非 穷尽 模式 时 (不 能 概括 该 类 型 所 有 的 值 ) 会 事先 提出 警告 ,表示 有 
这 种 异常 的 可 能 。 

由 于 很 多 函数 都 可 能 抛 出 Match， 使 得 这 个 异常 传递 的 信息 有 限 。 在 编写 函数 时 ， 可 以 让 
它 通过 显 式 地 抛 出 恰当 的 异常 来 拒绝 不 正确 的 参数 ， 最 后 一 个 情形 可 以 用 来 捕捉 任何 不 能 匹 
配 其 他 模式 的 值 。 有 些 程序 员 为 每 一 个 函数 声明 一 个 异常 ， 但 是 太 多 的 异常 会 导致 混乱 。 标 
准 库 走 的 是 中 间 路 线 ， 为 一 整 类 的 错误 声明 异常 ， 下 面 是 一 些 例子 。 

*。Overflow 是 针对 结果 超出 范围 的 算术 操作 的 。 

*Div 是 针对 除数 为 零 的 。 

“Domain 是 针对 涉及 结构 Math 的 函数 错误 的 ， 比 如 对 负数 取 平 方 根 或 对 数 。 

。Chr 是 针对 chr(k) 的 ， 当 k 是 无 效 的 字符 编码 时 抛 出 Chr。 

。Subscript 是 针对 下 标 越界 的 。 数 组 、 字 符 串 和 表 的 操作 可 能 抛 出 Subscript。 

。Size 是 针对 尝试 建立 大 小 为 负数 或 过 大 的 数组 、 字 符 串 或 表 的 。 

。Fail 是 针对 一 些 杂 类 错误 的 ， 它 带 有 一 个 字符 串 参数 来 表示 错误 信息 。 

库 结 构 List 声 明了 异常 Empty。 函 数 hd 和 zl 在 应 用 到 空 表 上 面 的 时 候 会 抛 出 这 个 异常 : 
exception Empty; 

fun hd (x::_) =x 

| hd [] = raise Empty; 
fun ¢l (_::xs) 
| a i 


返回 表 的 第 "个 元 素 〈 从 0 开始 计 ) 的 库 函 数 则 不 那么 简单 : 


exception Subscript; 


xs 
raise Empty; 


fun nth(x::_, 0) = x 
| nth(x: :xs, n) = if n>0 then nth(xs,n-1) 
else raise Subscript 
| nth _ = raise Subscript; 


对 nth(1, n) 的 计算 在 n < 0 或 /里面 没有 第 x 个 元 素 时 会 抛 出 异常 Subscript。 在 后 一 种 情况 下 ， 异 
常会 在 一 系列 对 nth 的 递归 调用 中 向 上 传播 。 


ntk (explode "At the pit of Acheron", 5); 
> #"e" : char 
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nth( [1,2], 2); 
> Exception: Subscript 


当 E 的 值 不 能 匹配 模式 P 的 时 候 ， 声 明 val P = E 抛 出 异常 Bind。 这 种 风格 通常 不 太 好 (不 过 请 
见 图 8-4)。 如 果 存 在 值 不 能 匹配 模式 的 可 能 ， 那 么 应 该 考虑 替代 的 办 法 ， 显 式 地 使 用 分 情 表 
达 式 : 


case E of P=>:.. | Py =>- 


4.8 处 理 异 常 


异常 处 理 器 测试 表达 式 的 结果 是 否 是 异常 包 。 如 果 是 ， 那 么 异常 包 的 内 容 ， 一 个 类 型 为 
exn 的 值 ， 可 以 被 分 情 处 理 。 具 有 异常 处 理 句 的 表达 式 在 构造 上 与 分 情 表达 式 很 类 似 : 
E handle P! => E! | © | Pa => En’ 


如 果 E 返 回 正常 值 ， 异 常 处 理 器 简单 地 将 它 传 出 去 。 相反， 如 果 E 返 回 一 个 异常 包 ， 那 么 它 的 
内 容 就 要 和 那些 模式 进行 匹配 。 如 果 已 是 第 一 个 匹配 的 模式 ， 则 天 就 是 要 返回 的 值 ， 这 里 ; = 
1, ..., Me 

有 一 点 和 分 情 表达 式 截然 不 同 。 如 果 没 有 匹配 的 模式 ， 那 么 异常 处 理 器 会 继续 传播 那个 
异常 包 ， 而 不 是 抛 出 异常 March。 通 常 ， 一 个 异常 处 理 器 并 不 会 考虑 所 有 可 能 的 异常 。 

在 3.7 节 中 ， 我 们 考虑 过 找 零钱 的 问题 。 那 时 的 贪 柳 式 算法 ( 函数 change) 不 会 将 16 表 示 
为 5 和 2 的 组 合 ， 这 是 因为 它 总 是 取 最 大 的 硬币 。 而 另 一 个 函数 ，allChange ， 则 通过 返回 所 有 
的 解 来 处 理 这 个 问题 。 

利用 异常 ， 可 以 很 容易 地 编写 回溯 算法 。 我 们 声明 异常 Change， 并 在 两 种 情况 下 抛 出 : 
一 种 是 在 非 零 余额 时 没有 硬币 可 选 ， 另 一 种 是 余额 为 负数 。 我 们 总 是 尝试 取 最 大 的 硬币 ， 并 
在 出 错时 退回 一 步 。 此 时 ， 异 常 处 理 器 总 是 退回 最 近 的 一 次 选择 ， 递 归 调 用 保证 了 这 一 点 。 


exception Change; 
fun backChange (coinvals, 0) = [] 
| backChange ([], amount) = raise Change 
| backChange (c::coinvals, amount) = 
if amount<0 then raise Change 
else c :: backChange(c::coinvals, amount-c) 
handle Change => backChange(coinvals, amount) ; 
> val change = fn : int list * int -> int list 


不 像 aliChange， 上 面 的 函数 最 多 返回 一 个 解 。 让 我 们 通过 重复 37 节 的 例子 来 比较 一 下 两 个 函数 : 


_ backChange({10,2], 27); 
> Exception: Change 
backChange ( [5,2], 16); 
> [5, 5, 2, 2, 2] : int list 
backChange (gb-coins, 16); 
> [10, 5, 1] : int list 


分 别 是 无 解 、 两 个 解 和 25 个 解 ， 我 们 最 多 能 得 到 其 中 的 一 个 。 类 似 的 关于 异常 处 理 的 例子 会 
出 现在 本 书 稍 后 章节 的 语法 分 析 与 合 一 的 问题 中 。 情 性 表 〈5.19 节 ) 是 异常 处 理 之 外 的 另 一 
个 选择 、 利 用 它 ， 可 以 按 需要 生成 多 个 解 。 
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A 异常 处 理 的 缺陷 。 就 像 其 他 形式 的 模式 匹配 一 样 ， 必 须 小 心地 编写 出 常 处 理 器 。 
二 万 不 要 把 异常 的 名 字 拼 错 ， 它 会 被 当 作 变量 而 匹配 所 有 的 异常 。 
if E then E, else E handle --- 


中 ， 异 常 处 理 器 只 会 检测 到 已 抛 出 的 异常 。 将 条 件 表 达 式 用 括号 括 起 来 ， 则 会 使 整 
个 表达 式 置 于 异常 处 理 器 的 作用 域内 。 类 似 地 ， 在 
case E of Pi => E, | © | Pa => E, handle --- 


2, RERESRABRMFLMEORF. 


分 情 表达 式 中 的 异常 处 理 器 可 能 会 出 现 语法 上 的 歧义 。 如 果 漏 掉 了 下 面 的 括号 ， 就 会 使 
分 情 表达 式 的 第 二 行 归属 于 异常 处 理 器 : 


case f u of [x] => (g x handle _ => x) 
| xs => gu 


49 对 异常 的 异议 
异常 可 以 成 为 模式 识别 的 一 个 笨拙 的 替代 品 ， 如 同 这 个 计算 表 长 度 的 函数 中 所 表示 的 那样: 


fun len | = 1 + len(tl 1) handle _ => 0; 
> val len = fn : ‘a list -> int 


用 全 表示 异常 包 ，!en[1] 的 计算 过 程 是 这 样 的 : 


len{1] > 1 + len(ti[1]) handle - => 0 
=> 1+/en{] handle . => 0 
> 1 + (1 + len(tl[]) handle - => 0) handle - => 0 
=>1+(1+lens handle - => 0) handle - => 0 
=>1+(1+a4 handle . => 0) handle - => 0 
=>1+(a handle . => 0) handle - => 0 
= 1+0 handle - => 0 
=>1 


这 个 计算 要 比 用 模式 匹配 定义 的 长 度 函 数 更 复杂 。 在 可 能 的 情况 下 ， 尽 量 事先 分 情 处 理 ， 而 
不 是 不 容 分 说 地 利用 异常 处 理 来 乱 试 一 气 。 

大 多 数 惰性 求 值 的 支持 者 都 反对 异常 处 理 。 异 常 使 得 理论 更 复杂 了 ， 而 且 有 可 能 被 误 用 ， 
就 像 我 们 刚才 所 看 到 的 。 实 际 的 了 矛盾 更 为 深入 。 异 常 是 根据 传 值 调 用 的 原则 传播 的 ， 而 惰性 
求 值 则 是 遵循 传 需 调 用 的 原则 传播 的 。 

ML 包括 赋值 命令 和 其 他 命令 ， 而 对 命令 式 程序 设计 来 说 ， 异 常 可 能 是 危险 的 。 当 执行 可 
能 在 任意 地 方 中 断 时 ， 写 出 正确 的 程序 是 很 困难 的 。 限 于 程序 的 消 数 式 部 分 ， 异 常 可 以 被 理 
解 为 将 值 空间 划分 为 普通 值 和 异常 包 。 虽 然 严 格 来 讲 ， 在 程序 设计 语言 中 异常 并 不 是 必需 的 ， 
而 且 还 可 能 被 误 用 ,但 是 它 却 可 以 使 程序 更 清晰 、 更 高 效 。 


练习 4.11 类 型 exn 不 允许 进行 ML 的 相等 测试 。 这 个 限制 合理 吗 ? 
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练习 4.12 根据 你 的 经 验 叙述 一 个 适合 运用 异常 处 理 的 计算 问题 。 书 写 一 个 ML 程序 的 框架 来 
解决 这 个 问题 。 要 包括 异常 的 声明 ， 以 及 讲述 在 什么 地 方 抛 出 和 处 理 异 常 。 


树 


树 (tree) 是 一 种 分 支 结构 ， 它 由 结 点 (node) 组 成 ， 这 些 结 点 包含 有 通 向 子 树 的 分 支 
(branch)。 结 点 可 以 带 有 值 ， 称 为 标签 (label)。 尽 管 叫 做 树 ， 但 通常 这 个 数据 结构 的 树 都 是 


倒 着 画 的 : 
Q 
O w 
O © 
四 


标签 为 4 的 结 点 是 树 的 根 (root) ， 而 结 点 C、D、F 和 已 (它们 没有 子 树 ) 是 树 的 叶子 (leaf). 

结 点 的 类 型 决定 了 标签 的 类 型 ， 以 及 它 可 以 有 多 少 棵 子 树 。 而 树 的 类 型 又 决定 了 结 点 的 
类 型 。 有 两 种 类 型 的 树 是 非常 重要 的 。 第 一 种 树 中 有 带 标签 的 结 点 ， 每 个 结 点 有 一 个 分 支 ， 
最 后 以 一 个 没有 标签 的 叶子 结束 ， 这 种 树 就 是 表 。 第 二 种 树 和 表 的 不 同 之 处 在 于 有 标签 的 结 
点 都 有 两 个 分 支 而 不 是 一 个 ， 这 种 树 叫做 二 又 树 (binary tree). 

当 函 数 式 程序 员 使 用 表 的 时 候 ， 他 们 可 以 依赖 成 套 的 技术 和 函数 库 。 而 当 使 用 树 时 ， 通 
常 都 要 自己 来 安排 了 。 这 很 遗憾 ， 因 为 二 叉 树 对 于 许多 应 用 都 是 很 理想 的 。 下 面 的 几 节 会 将 
二 又 树 应 用 到 查询 、 数 组 和 优先 队列 上 。 我 们 要 为 二 又 树 开发 一 个 多 态 函 数 库 。 


4.10 二 又 树 类 型 


二 叉 树 具有 分 支 结 点 ， 每 个 结 点 有 一 个 标签 和 两 棵 子 树 。 二 又 树 的 叶子 是 没有 标签 的 。 
要 在 ML 里 定义 二 叉 树 需要 递归 的 数据 类 型 声明 : 

datatype ‘a tree = Lf 

| Br of ‘a * ‘a tree * ‘a tree; 

可 以 像 非 递归 数据 类 型 那样 来 理解 递归 数据 类 型 。 类 型 z iree 是 由 所 有 可 以 通过 Lf 和 Br 构成 的 
值 组 成 的 。 至 少 存在 一 个 t tree, AILS, 并 且 给 定 两 棵 树 和 一 个 类 型 为 z 的 值 ， 我 们 可 以 构造 另 
一 棵 树 。 因 此 ，L/ 是 递归 的 基本 情形 。 

下 面 是 一 棵 以 字符 串 为 标签 的 树 : 

val birnam = 

Br("The", Br("wood", Lf, 
Br("of", Br("Birnam", Lf, Lf), 


Lf)), 
Lf); 
> val birnam = Br ("The", ... , Lf) : string tree 
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下 面 是 一 些 以 整数 为 标签 的 树 。 注 意 树 是 怎样 被 组 成 更 大 的 树 的 。 


val tree2 = Br(2, Br(1,1f,1f), Br(3,Lf,lf)); 

> val tree2 = Br (2, Br (1, Lf, Lf), 

> Br (3, Lf, Lf)) : int tree 
val treeS = Br(5, Br(6,Lf,Lf), Br(7,Lf.Lf)); 

> val tree5 = Br (5, Br (6, Lf, Lf), 

> Br (7, Lf, L£)) : int tree 
val tree4 = Br(4, tree2, tree5); 

> val treed = 


> Br (4, Br (2, Br (1, Lf, Lf), 


> Br (3, Lf, Lf)), 
> Br (5, Br (6, Lf, Lf), 
> Br (7, Lf, Lf))) : int tree 


树 birnam 和 tree4 如 下 图 所 示 : 





叶子 在 上 面 用 方块 表示 ， 不 过 以 后 就 会 被 省 略 了 。 
树 的 操作 表达 为 使 用 模式 匹配 的 递归 函数 ， 多 态 函 数 size 返 回 了 树 中 的 标签 数 : 


fun size Lf = 0 
| size (Br(v,tl,f2)) = 1 + size th + size 12; 
> val size = fn : ‘a tree -> int 
size birnam; 
> 4: int 
size tree4; 


> 7 : int 


对 于 树 的 大 小 的 另 一 个 量度 标准 是 它 的 深度 depth:， 从 根 到 叶子 的 最 长 路 径 。 
fun depth Lf 0 


| depth (Br(v,tl,12)) = 1 + Int.max(depth tl, depth 12); 
> val depth = fn : ‘a tree -> int 
depth birnam; 
> 4: int 
depth tree4; 
> 3 : int 


可 以 看 到 birnam 是 相当 深 的 ， 而 tree4 则 是 尽 可 能 地 浅 。 如 果 ! 是 一 棵 二 又 树 ， 则 有 
size(t) < 2m — 1 


如 果 ! 满 足 size(D = 24°" - 1， 那 么 它 就 是 一 棵 完全 二 又 树 (complete binary tree)。 例 如 ， 
tree4 就 是 一 棵 深度 为 3 的 完全 二 又 树 。 l 


a 
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通俗 地 讲 ， 当 一 棵 二 叉 树 的 每 一 个 结 点 的 两 棵 子 树 都 具有 相似 的 大 小 时 ， 我 们 说 树 是 平 
衡 的 (balanced)。 这 个 概念 可 以 通过 几 种 方式 精确 化 。 到 达 树 的 一 个 结 点 的 开销 和 树 的 深度 
成 正比 ， 而 对 于 平衡 树 ， 则 是 结 点 个 数 的 对 数 。 深 度 为 10 的 完全 二 又 树 包含 了 1 023 个 结 点 ， 
最 多 九 步 内 都 可 以 到 达 。 一 棵 深度 为 20 的 树 可 以 包含 超过 10' 个 结 点 。 平 衡 树 可 以 对 大 量 的 数 
据 进 行 高 效 的 访问 。 

调用 comptree(1,n) 可 以 建立 一 个 深度 为 n 的 完全 二 又 树 ， 它 的 结 点 标签 为 1 到 2” - 1: 

fun comptree (k,n) = 

if n=0 then Lf 
else Br(k, comptree(2*k, n-1), 
comptree(2*k+1, n-1)); 

> val comptree = fn : int * int -> int tree 

comptree (1,3); 

> Br (1, Br (2, Br (4, Lf, Lf), 


> Br (5, Lf, Lf)), 
> Br (3, Br (6, Lf, Lf), 
> Br (7, Lf, Lf))) : int tree 


reftect 是 一 个 作用 在 树 上 的 函数 ， 它 实现 了 树 的 镜像 ， 办 法 是 从 上 到 下 地 交换 左右 子 树 : 


fun reflect Lf = Lf 
| reflect (Br(v,t1,2)) = Br(v, reflect 12, reflect tl); 
> val reflect = fn : ‘a tree -> ‘a tree 


reflect tree4; 
> Br (4, Br (5, Br (7, Lf, Lf), 


> Br (6, Lf, Lf)), 
> Br (2, Br (3, Lf, Lf), 
> Br (1, Lf, Lf))) : int tree 


练习 4.13 ”书写 一 个 函数 compsame(x, n) 来 构造 一 棵 深度 为 4 的 完全 二 又 树 ， 并 将 所 有 结 点 标 
签 为 x-。 你 的 函数 的 效率 怎样 ? 

练习 4.14 ” 当 二 又 树 的 每 个 结 点 Br(x, ty, 12) 都 满足 | size(t,) - size(h)| < 1 时 ， 它 就 是 (RK) 
平衡 的 。 最 简单 的 检测 树 是 否 平衡 的 递归 函数 就 是 将 size 应 用 到 每 一 棵 子 树 上 ， 但 这 样 会 进行 
很 多 元 余 的 计算 。 书 写 一 个 高 效 的 函数 来 检测 树 是 否 平衡 。 

练习 4.15 ”书写 一 个 函数 来 判定 任意 的 两 棵 树 : 和 Hu 是否 满 足 ! = reflect(u). 要 求 这 个 函数 不 能 
构造 新 树 ， 因 此 它 不 能 调用 reflect 和 Br， 不 过 它 可 以 在 模式 中 使 用 Br。 

练习 4.16 表 并 没有 必要 内 置 在 ML 语言 中 。 给 出 一 个 和 a list 等 价 的 数据 类 型 声明 。 

练习 4.17 声明 一 个 标签 二 叉 树 的 数据 类 型 (a, PB)ltree， 其 中 分 支 结 点 具有 类 型 为 a 的 标签 ， 
叶子 则 上 共有 类 型 为 B 的 标签 。 

练习 4.18 ”声明 一 个 树 的 数据 类 型 ， 其 中 树 的 每 个 分 支 结 点 可 以 有 任意 有 限 数目 的 分 支 。( 提 
示 : EMR.) 


4.11 枚 举 树 的 内 容 


考虑 这 样 一 个 问题 ， 就 是 构造 一 个 由 树 的 标签 所 组 成 的 表 。 标 签 必须 按照 某 种 顺序 排列 。 
有 三 种 著名 的 顺序 ， 前 序 ee 中 序 (inorder) 和 后 序 (postorder)， 可 以 被 树 的 递归 
函数 所 描述 。 给 定 一 个 结 点 ， 一 种 顺序 都 是 将 左 子 树 的 标签 放 在 右 子 树 的 标签 前 ; 这 些 顺 
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序 仅 在 给 定 结 点 的 标签 位 置 上 有 所 不 同 。 
前 序列 表 将 给 定 结 点 的 标签 放 在 前 面 : 


fun preorder Lf = 
| preorder (Br(v,t1,12)) = 


[] 
[v] @ preorder tl @ preorder t2; 


> val preorder = fn : ʻa tree -> ‘a list 
preorder birnam; 

> ["The", "wood", "of", "Birnam"] : string list 
preorder tree4; 

> [4, 2, 1, 3, 5, 6, 7] : int list 


中 序列 表 将 给 定 结 点 的 标签 放 在 左右 子 树 标签 之 间 ， 这 给 出 了 严格 的 由 左 到 右 的 遍历 : 


fun inorder Lf = 
| inorder (Br(v,tl,t2)) = 
‘a 


[] 
inorder tl @ [v] @ inorder 12; 


> val inorder = fn: tree -> ‘a list 

inorder birnam; 

> ["wood", "Birnam", "of", "The"] : string list 
inorder tree4; 

> [1, 2, 3, 4, 6, 5, 7] : int list 


后 序列 表 将 给 定 结 点 的 标签 放 在 最 后 : 


fun postorder Lf = 
| postorder (Br(v,tl,12)) = 


> val postorder = 
postorder birnam; 


fn: ’ 


[] 
postorder tl @ postorder t2 @ [v]; 
a tree -> ‘a list 


> ["Birnam", | "of", "wood", "The"] : string list 
postorder tree4; 
> [1, 3, 2, 6, 7, 5, 4] : int list 


虽然 这 些 函 数 非常 清楚 ， 但 是 它们 却 需 要 四 次 方 的 时 间 来 处 理 非 常 不 平衡 的 树 。 罪 鬼神 首 是 
长 表 的 追加 (e)。 通 过 使 用 额外 的 参数 vs 来 积累 标签 ， 可 以 省 掉 这 个 操作 。 下 面 的 版 本 对 每 
一 个 分 支 结 点 恰好 进行 一 次 构造 〈: : ) 操作 : 


fun preord (Lf, vs) 
| preord (Br(v,t1,t2), vs) 


fun inord (Lf, vs) 
| inord (Br(v,tl,t2), vs) 


fun postord (Lf, vs) 
| postord (Br(v,tl,f2), vs) 


= vs 
= vis 


preord (tl, preord(t2,vs))i 


= vs 
= inord(tl, v::inord(t2,vs)); 


= vs 
= postord (tl, postord(t2,v::vs)); 


这 些 定义 是 值得 研究 的 ， 因 为 很 多 函数 都 是 类 似 这 样 声明 的 。 例 如 ， 逻 辑 项 本 质 上 是 树 ， 某 
项 中 的 所 有 常量 的 列表 就 可 以 像 上 面 这 样 建立 。 


练习 4.19 ”描述 inorder(birnam) 和 inord(birnam, []) 是 怎样 计算 的 ， 说 明 各 进行 了 多 少 次 构造 


操作 。 


练习 4.20 ”完成 下 面 的 等 式 ， 并 解释 其 正确 性 。 


preorder(reflect(t)) =? 
inorder(reflect(t)) =? 
postorder(reflect(t)) =? 
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4.12 由 表 建 立 树 


现在 来 考虑 将 放 在 一 个 表 里 的 标签 转换 成 一 棵 树 。 前 序 、 中 序 和 后 序 的 概念 也 适用 于 这 
个 逆 操 作 。 就 算是 按照 同一 个 顺序 ， 一 个 表 也 可 以 转换 成 很 多 不 同 的 树 。 下 面 的 方程 
preorder(t) = [1, 2, 3] 


Gob PY, 


这 些 树 里 面具 有 一 棵 是 平衡 的 。 要 想 构 造 平衡 树 ， 就 要 将 标签 的 列表 大 致 分 为 两 半 。 这 样 ， 
两 棵 子 树 的 大 小 ( 结 点 的 个 数 ) 最 多 可 能 只 差 1 个 结 点 。 
要 用 前 序 标签 表 来 创建 平衡 树 ， 就 要 将 第 一 个 标签 放 在 树 的 根 结 点 上 : 
fun balpre {] = If 
| balpre (x: :xs) = 
let val k = length xs div 2 
in Br(x, balpre (List .take(xs,k)), balpre (List .drop(xs,k))) 


对 于 ! 有 5 个 解 : 


end; 
> val balpre = fn : ‘a list -> ‘a tree 
XA FAK AE preorder HI iH PAB 


balpre (explode "“Macbeth") ; 
> Br (#"M", Br (#"a", Br (#"c", Lf, Lf), 


> Br (#"b", Lf, Lf)), 
> Br (#"e", Br (#"t", Lf, Lf), 
> Br (#"h", Lf, Lf))) : char tree 


implode (preorder it) ; 
> "Macbeth" : string 


要 用 中 序 表 来 创建 平衡 树 ， 就 必须 从 中 间 取 根 结 点 标签 。 这 类 似 于 3.21 节 的 自 顶 向 下 合并 
排序 : 


fun balin {} = Lf 
| balin xs = 
let val k = length xs div 2 
val y::ys = List.drop(xs,k) 
in Br(y, balin (List.take(xs,k)), balin ys) 


end; 
> val balin = fn : ʻa list -> ‘a tree 
这 个 函数 是 imorder 的 逆 国 数 。 


balin (explode “Macbeth") ; 
> Br (#"b", Br (#"a", Br (#"M", Lf, Lf), 


> Br (#"c", Lf, Lf)), 
> Br (#"t", Br (#"e", Lf, LF), 
> Br (#"h", Lf, L£))) : char tree 


implode (inorder it) ; 
> "Macbeth" : string~ 
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练习 4.21 书写 一 个 函数 将 后 序 标签 表 转 换 成 平衡 树 。 


练习 4.22 ”了 阅 数 balpre 利 用 前 序 表 构 造 了 一 棵 树 。 书 写 一 个 函数 ， 对 于 给 定 的 一 个 标签 表 ， 构 
造 出 所 有 前 序列 表 等 于 这 个 标签 表 的 树 。 


4.13 为 二 叉 树 设计 的 结构 


像 以 往 一 样 ， 我 们 伴随 着 一 个 假想 的 ML 会 话 ， 逐 个 地 敲 出 了 树 的 国 数 。 现 在 我 们 应 该 将 
最 重要 的 一 些 函 数 收集 起 来 放 进 一 个 结构 ， 称 这 个 结构 为 Tree。 我 们 确实 必须 这 么 做 ， 因 为 
我 们 的 一 个 函数 (size) 和 内 置 的 函数 冲突 了 。 使 用 结构 的 原因 之 一 是 避免 这 种 名 字 冲 突 。 

但 是 .我 们 应 该 把 树 的 数据 类 型 声明 留 在 结构 之 外 。 如 果 不 这 样 做 ， 就 要 被 迫使 用 
Tree .Lf 和 Tree .Br 来 引用 构造 子 ， 这 会 使 得 模式 很 难 阅读 。。 因 此， 接 下 来 我 们 假设 已 经 做 了 
下 列 的 声明 : 

datatype ‘a tree = Lf 


| Br of ‘a * ‘a tree * ‘a tree; 


structure Tree = 

struct 

fun size Lf = 0 
| size (Br(v,tl,t2)) = 1 + size tl + size 12; 

fun depth 

fun reflect... 

fun preord ... 

fun inord 

fun postord ... 

fun balpre ... 

fun balin 

fun balpost ... 

end; 


练习 4.23 ”让 我 们 把 数据 类 型 声明 放 进 结构 内 ， 然 后 用 下 面 的 声明 使 得 构造 子 直接 对 外 可 见 : 
val Lf = Tree.Lf; 
val Br = Tree.Br; 


这 个 想法 错 在 哪里 ? 
基于 树 的 数据 结构 


计算 机 程序 设计 就 是 根据 一 套 给 定 的 基本 操作 来 按 需要 实现 一 套 高 级 操作 。 那 些 高 级 操 
作 又 可 以 成 为 下 一 个 层次 的 程序 编写 的 基本 操作 。 分 层 的 网 络 协议 就 是 这 个 原则 的 一 个 突出 
的 例子 ， 在 任何 模块 化 系统 设计 中 都 可 以 见 到 这 个 原则 。 

考虑 简单 一 点 的 数据 结构 设计 。 我 们 的 任务 是 要 基于 程序 设计 语言 提供 的 基本 数据 结构 
来 实现 所 需 的 数据 结构 。 这 里 ， 数 据 结 构 不 仅仅 是 描述 为 它 的 内 部 实现 ， 而 且 也 包括 它 所 支 
持 的 操作 。 为 了 实现 新 的 数据 结构 ， 我 们 必须 清楚 地 知道 所 希望 的 那 套 操作 是 什么 。 


O ”有 一 种 办 法 ，open 声 明 ， 可 以 让 一 个 结构 的 组 件 名 字 直 接 被 看 到 ， 像 志和 Br 那样 。 然而， 打开 整个 Tree 结 
构 首先 就 破坏 了 声明 这 个 结构 的 目的 。7.14 节 会 讨论 多 种 处 理 复合 名 字 的 办 法 。 
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ML 有 两 个 很 大 的 优点 。 它 的 基本 特性 可 以 很 简单 地 描述 树 ， 我 们 不 需要 担心 引用 和 分 配 
空间 。 另 外 ， 可 以 通过 签名 来 描述 所 希望 的 整套 操作 。 

关于 数据 集 的 典型 操作 包括 插入 数据 、 查 找 数据 、 删 除数 据 以 及 合并 两 个 数据 集 。 我 们 
来 考虑 三 种 可 以 用 树 来 表示 的 数据 结构 : 

“字典 ， 其 中 数据 项 是 用 名 字 来 标识 的 。 

“数组 ， 其 中 数据 项 是 用 整数 来 标识 的 。 

“优先 队列 ， 其 中 数据 项 是 用 优先 级 来 标识 的 : 只 有 优先 级 最 大 的 项 可 以 被 删除 。 
和 其 他 课本 中 所 描述 的 数据 结构 不 同 ， 这 里 的 数据 结构 是 纯 函 数 式 的 。 播 入 和 删除 数据 项 不 会 改 
变数 据 集 ， 而 只 是 建立 一 个 新 的 数据 集 。 当 听 说 这 样 做 效率 也 很 高 的 时 候 ， 你 可 能 会 觉得 惊讶 。 


4.14 字典 


FH (dictionary) 是 一 些 项 的 集合 ， 每 个 数据 项 由 唯一 的 键 值 (通常 是 字符 串 ) 来 标识 。 
它 支 持 下 面 的 操作 : 

“查找 (lookup) 一 个 键 值 并 返回 相关 联 的 数据 项 。 

“插入 (insert) 新 的 键 值 (原来 没有 的 ) 以 及 相关 的 数据 项 。 

。 更 新 (update) 现 有 键 值 相关 联 的 数据 项 (如果 键 值 不 存在 则 进行 插入 )。 
我 们 可 以 通过 ML 签名 来 使 这 个 描述 变 得 更 精确 : 


signature DICTIONARY = 
sig 


type key 

type ‘at 

exception E of key 

val empty : ‘at 

val lookup : 'a t * key -> ‘a 

val insert : 'a t * key * 'a -> ‘at 
val update : ‘at * key * ‘a -> ‘at 


end; 
VEAP RGR ESER IPSEC EBERT ES « 多 出 来 的 是 下 什么 的 呢 ? 

。key 是 搜索 键 值 的 类 型 。 

。at 是 字典 的 类 型 ， 里面 存储 的 数据 项 具有 类 型 a。 

*E 是 当 错 误 发 生 时 要 抛 出 的 一 个 异常 。 在 找 不 到 键 值 的 上 时候， 会 导致 查找 失败 ， 而 在 键 

值 已 经 存在 的 上 时候， 会 导致 插入 失败 。 异 常 带 有 被 拒绝 的 键 值 。 

+ empty Res FBR 
和 这 个 签名 匹配 的 结构 必须 声明 适当 类 型 的 字典 操作 。 例 如 ， 函 数 /ookup 需 要 一 个 字典 和 一 
个 键 值 作为 参数 ， 并 返回 一 个 数据 项 。 在 签名 DICTIONARY 里 并 没有 提 到 树 ， 因 此 可 以 采用 
任何 一 种 表示 方法 。 

二 又 搜 索 树 可 以 实现 字典 。 一 棵 合理 的 平衡 树 (图 4-1) 要 比 一 个 (key, item) RRR 
高 效 得 多 。 对 于 表 ， 在 n 个 项 中 搜索 一 个 键 值 需要 O(n) 时 间 ， 而 对 于 二 又 搜索 树 来 说 则 仅 需要 
O(log nn) 时 间 。 更 新 树 的 时 间 也 是 O(log n). 关联 表 可 以 在 常数 时 间 内 更 新 ， 但 是 这 并 不 能 补 
偿 其 较 长 的 搜索 时 间 。 


O 在 这 里 是 字符 串 ; 7.10 节 将 会 推广 二 又 搜索 树 ， 将 搜索 键 值 的 类 型 作为 一 个 参数 。 
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图 4-1 一 棵 平衡 的 二 又 搜索 树 


在 最 坏 的 情况 下 ， 二 又 搜索 树 实际 上 要 比 关联 表 更 慢 。 一 系列 的 更 新 可 能 会 构造 出 一 棵 
很 不 平衡 的 树 。 搜 索 和 更 新 n 个 数据 项 的 树 可 能 会 需要 n 步 。 

关联 表 中 的 键 值 类 型 只 要 满足 相等 测试 就 可 以 了 ， 但 是 二 又 搜索 树 中 的 键 值 必须 是 线性 
有 序 的 。 使 用 按照 字母 顺序 排序 的 字符 串 是 个 不 错 的 选择 。 树 的 每 一 个 分 支 结 点 都 存放 着 一 
个 (string, item) 序 偶 ; 它 的 左 子 树 只 存放 较 小 的 字符 串 ; 右 子 树 则 只 存放 较 大 的 字符 串 。 中 序 
标签 表 将 字符 串 按 字母 顺序 进行 排列 。 

与 Pascal 中 编码 的 树 操作 不 同 ， 更 新 和 插入 操作 不 会 改变 现 有 的 树 ， 而 是 建立 一 棵 新 树 。 
这 并 不 像 听 起 来 那么 浪费 : 新 树 共 享 了 大 部 分 旧 树 的 空间 。? 

图 4-2 展 示 了 结构 Dict， 它 是 签名 DICTIONARY 的 一 个 实例 。 它 从 声明 类 型 key 和 a WRF 
常 E 开 始 。 新 声明 的 类 型 仅仅 是 缩写 ， 但 却 是 必需 的 ， 主 要 是 为 了 满足 签名 的 需要 。 

structure Dict : DICTIONARY = 


struct 


string; 


(key * 'a) tree; 


type key 
type ‘a t 


exception E of key; 
val empty = Lf; 


fun lookup (Lf, b) = 
| lookup (Br ((a,x),t1,12), b) = 
(case String.compare(a,b) of 
GREATER => lookup(ti, b) 
| EQUAL => x 
| LESS => lookup(t2, b)); 


raise E b 


fun insert (Lf, b, y) = Bri(b,y), Lf, Uf) 
| insert (Br((a,x),t1,12), b, y) = 
(case String.compare(a,6) of 
GREATER => Br ((a,x),  insert(tl,b,y), t2) 
| EQUAL => raise E b 
| LESS => Br ({a,x), tl, — insert(1t2,b,y))); 


fun update (Lf, b, y) Br((b,y), Lf, Lf) 
| update (Br((a,x) ,tl,12), b, y) 
(case String .compare (a,b) of 
GREATER => Br ((a,x), update(tl,b,y), t2) 
| EQUAL => Br ((a,y), tl, #2) 
| LESS => Br ((a,x), tl, update(t2,b,y))); 





图 4-2 一 个 用 二 叉 搜 索 树 实现 的 


4} 
Æ 
X 
rs 


日 读者 可 以 回忆 -- 下 3.5 节 的 注解 。 一 一 译 者 注 
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二 又 搜索 树 中 的 查找 是 很 简单 的 。 在 分 支 结 点 处 ， 如 果 要 查找 的 数据 项 比 当前 标签 小 则 
看 左 子 树 ， 大 则 看 右 子 树 。 如 果 数 据 项 设 找到 则 抛 出 异常 下 。 注 意 观察 对 于 数据 类 型 order 的 
使 用 。 

播 和 人 序 偶 (srrin8g, item) 涉 及 到 确定 string 的 正确 位 置 ， 然 后 插入 item。 就 像 lookup 一 样 ， 通 
过 和 当前 结 点 的 标签 进行 比较 来 确定 是 向 左 找 还 是 向 右 找 。 这 样 得 到 的 结果 是 一 个 新 的 分 支 
结 点 ; 其 中 一 棵 子 树 被 更 新 了 ， 而 另 一 个 则 是 借用 原来 的 。 如 果 在 树 中 找到 了 该 字符 串 ， 则 
抛 出 异常 。 

实质 上 ，insert 是 复制 了 从 根 结 点 到 新 结 点 的 路 径 。 函 数 update 除 了 在 发 现 字 符 串 的 情况 
下 结果 不 同 ， 其 他 和 insert 完 全 一 样 。 

lookup 中 的 异常 是 很 容易 去 掉 的 ， 因 为 这 个 函数 是 迭代 的 。 它 可 以 返回 一 个 类 型 为 
a option 的 结果 ， 如 果 键 值 被 找到 则 结果 为 SOME x， 否 则 结果 为 NONE。 而 insert 里 面 的 异常 
就 是 另外 一 回 事 了 : 由 于 那些 递归 调用 构造 了 一 棵 新 树 ， 返 回 SOME 1 或 NONE 是 很 麻烦 的 。 
函数 insert 可 以 先 调用 ookup 再 调用 xpdate， 这 样 虽然 去 掉 了 异常 ， 但 比较 次 数 却 又 加 倍 了 。 

二 又 搜索 树 是 从 空 树 (L) 开始 ， 通 过 不 断 地 更 新 和 插入 建立 起 来 的 。 我 们 建立 一 棵 树 
ctreel， 包 括 France 和 Egypt: 


Dict .insert(Lf, "France", 33); 

> Br (("France", 33), Lf, Lf) : int Dict.t 
val cfreel = Dict.insert(it, "Egypt", 20); 

> val ctreel = Br (("France", 33), 


> Br (("Egypt", 20), Lf, Lf), 
> Lf) : int Dict.t 
再 插入 Hungary 和 Mexico: 


Dict . insert (ctreel, "Hungary", 36); 

> Br (("France", 33), Br (("Egypt", 20), Lf, L£), 

> Br (("Hungary", 36), Lf, Lf)) : int Dict.t 
Dict . insert (it, "Mexico", 52); 

> Br (("France", 33), Br (("Egypt", 20), Lf, Lf), 

> Br (("Hungary", 36), Lf, ‘ 

> Br (("Mexico", 52), Lf, Lf))) : int Dict.t 


通过 插入 Japan， 我 们 建立 含有 5 个 数据 项 的 树 ctree2。 


val ctree2 = Dict.update(it, "Japan", 81); 
> val ctree2 = 
> Br (("France", 33), Br (("Egypt", 20), Lf, Lf), 
> Br (("Hungary", 36), Lf, 
Br (("Mexico", 52), 
Br (("Japan", 81), Lf, Lf), 
Lf))) : int Dict.t 


注意 ，ctreel 仍 旧 存 在 ， 虽 然 ctree2 是 由 它 构 造 的 。 


Dict . lookup (ctreel, "France"); 


vv y 


> 33 : int 
Dict . lookup (ctree2, "Mexico"); 
> 52 : int 


Dict . lookup (ctreel, "Mexico"); 
> Exception: E 
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随机 地 插入 数据 项 会 构造 出 不 平衡 的 树 。 如 果 在 进行 了 大 多 数 的 插入 操作 之 后 ， 紧 跟着 有 许 
多 查找 的 话 ， 那 么 在 查找 之 前 有 必要 将 树 做 一 下 平衡 。 由 于 二 叉 搜 索 树 与 有 序 的 中 序列 表 是 
对 应 的 ， 所 以 可 以 将 它 先 转换 成 中 序 表 ， 然 后 再 由 中 序 表 来 构造 新 树 ， 最 终 实现 平衡 : 

Tree .inord (ctree2, (1); 

> [("Egypt", 20), ("France", 33), ("Hungary", 36), 

> ("Japan", 81), ("Mexico”", 52)] : (Dict.key * int) list 

val baltree = Tree.balin it; 

> val baltree = 

> Br (("Hungary", 36), 

> Br (("France", 33), Br (("Egypt", 20), Lf, Lf), Lf), 


> Br (("Mexico", 52), Br (("Japan", 81), Lf, Lf), Lf)) 
> : (Dict.key * int) tree 


这 就 是 图 4-1 所 描绘 的 树 。 


Ol 平衡 树 算法 。 上 面 提 到 的 平衡 方法 是 有 局 限 性 的 。 使 用 inord 和 balin 依 赖 于 字典 
的 内 部 表示 是 树 ; 结果 的 类 型 现在 是 tree 而 不 是 Dict.t。 更 糟 的 是 ， 使 用 者 必须 决定 
什么 时 候 进 行 平衡 。 

有 几 种 搜索 树 是 可 以 自动 保持 平衡 的 ， 通 常 是 在 更 新 或 查找 的 同时 重新 排列 结 
点 。Adams (1993) 展示 了 自 平衡 二 又 搜索 树 的 ML 代码 。Reade (1992) 展示 了 用 
函数 式 实现 的 2-3 树 ， 这 种 树 的 每 个 结 点 可 以 有 两 个 或 三 个 子 结 点 。 


练习 4.24 ”给 出 四 个 二 又 搜索 树 的 例子 ， 这 些 树 的 深度 为 5， 并 只 含有 ctree2 的 5 个 标签 。 对 
于 每 一 个 例子 ， 给 出 一 个 可 以 建立 这 棵 树 的 播 入 序列 。 


练习 4.25 ”书写 一 个 新 的 结构 Dict， 其 中 字典 用 (key, item) 的 序 偶 表 来 表示 ， 表 元 素 按键 值 
排序 。 


4.15 函数 式 数 组 和 弹性 数组 


数组 是 什么 ?对 于 大 多 数 程序 员 来 说 ， 数 组 是 一 组 可 更 新 的 存储 单元 ， 这 组 单元 以 整数 
作为 索引 。 传 统 的 程序 设计 技巧 主要 是 关心 怎样 有 效 地 使 用 数组 。 由 于 多 数 的 数组 是 按 顺 序 
扫描 的 ， 因 此 函数 式 程序 设计 员 可 以 用 表 来 代替 数组 。 然 而 许多 应 用 ， 如 最 简单 的 散 列 表 和 
柱状 图 ， 是 需要 随机 访问 的 。 

本 质 上 ， 数 组 是 定义 在 有 限 范 围 整 数 上 的 一 个 映射 。 将 和 整数 关联 的 元 素 写成 4[ 妇 。 传 
统 上 ， 数 组 是 通过 赋值 命令 

A[k] := x 

来 更 新 的 ， 这 改变 了 机 器 状态 使 得 4[k] = x。 之 前 [中 存储 的 内 容 就 不 存在 了 。 原 地 更 新 在 
时 间 和 空间 上 都 是 非常 高 效 的 ， 但 是 很 难 与 函数 式 程序 设计 相互 和 谐 。 

函数 式 数组 提供 了 由 整数 到 数组 元 素 的 映射 ， 通 过 更 新 操作 建立 一 个 新 的 数组 

B = update (A, k, x) 

EM EAI + DAB) = ALAIBIA = x。 数 组 4 仍然 存在 ， 还 可 以 用 它 创建 新 的 数组 。 函 
数 式 数组 可 以 用 二 叉 树 来 实现 。 下 标 k 在 树 中 的 位 置 可 以 这 样 计算 : 从 树 的 根 开始 不 断 地 将 
除 以 2 ， 直 至 简化 到 1 为 止 。 每 一 步 所 得 的 余数 ， 如 果 为 0 则 转 到 左 子 树 ， 为 1 则 转 到 右 子 树 。 
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例如 下 标 12 可 以 通过 左 、 左 、 右 到 达 : 





弹性 (flexible) 数组 增加 了 在 数组 两 端 插入 和 删除 的 操作 ， 对 通常 的 查询 和 更 新 操作 做 了 扩 
充 。 程 序 由 一 个 空 数组 开始 根据 需要 播 人 数组 元 素 。 数 组 中 不 允许 有 空隙 : 元 素 n+1 必 须 在 元 
素 " 之 后 定义 ， 这 里 > 0。 让 我 们 考察 一 下 底层 的 树 操 作 ， 它 们 要 归功 于 W. Braun. 

( 依 下 标 ) 查询 函数 ，sz&b， 不 断 地 将 下 标 除 以 2 直到 1 为 止 。 如 果 余 数 为 0， 国 数 转向 左 子 
树 ， 否 则 转向 右 子 树 。 如 果 到 达 一 个 叶子 ， 那 么 函数 通过 标准 的 异常 来 发 出 错误 信号 。 


fun sub (Lf, _) 
| sub (Br(v,ti,12), k) 
if k = 1 then v 
else if k mod 2 = 0 
then sub (tl, k div 2) 
else sub (12, k div 2); 
> val sub = fn : ‘a tree * int -> ‘a 


更 新 函数 ，update， 也 是 不 断 地 将 下 标 除 以 2。 当 到 达 1 时 ， 它 将 分 支 结 点 替换 成 另 一 个 具有 
新 标签 的 分 支 。 一 个 叶子 可 以 被 替换 成 分 支 结 点 ， 这 样 就 扩展 了 数组 ， 但 必须 保证 不 会 加 入 
吊 在 中 间 的 结 点 ， 这 就 是 使 数组 没有 空隙 了 。 


fun update (Lf, k, w) = 
if k = 1 then Br (w, Lf, Lf) 
else raise Subscript 
| update (Br(v,tl,t2), k, w) = 
if k = 1 then Br (w, tl, 12) 
else if k mod 2 = 0 
then Br (v, update(ti, k div 2, w), 12) 
else Br (v, tl, update(i2, k div 2, w)); 
> val update = fn : ‘a tree * int * ‘a -> ‘a tree 


调用 delete(ta, n) 将 以 位 置 n 为 根 的 子 树 (如 果 存 在 的 话 ) 替换 成 叶子。 这 类 似 sub、 多 别 在 于 
它 建立 了 一 棵 新 树 。 
fun delete (Lf, n) 
| delete (Bri(v,tl,t2), n) 
if n = 1 then Lf 
else if n mod 2 = 0 
then Br (v, delete(tl, n div 2), 12) 


else Br (v, tl, delete(t2, n div 2)); 
> val delete = fn : ‘a tree * int -> ‘a tree 


通过 弹性 数组 的 上 端 ( 右 端 ) 来 扩展 和 缩小 数组 是 很 容易 的 。 只 要 将 上 界 和 二 叉 树 存储 在 一 
起 并 使 用 update 和 delete 就 行 了 。 但 是 我 们 怎样 才能 从 下 端 ( 左 端 ) 对 数组 进行 扩展 和 缩小 
We? 由 于 数组 的 下 界 是 固定 的 ， 这 好 像 隐 含 了 所 有 数组 元 素 的 移 位 。 

HEATA R) 向 一 棵 树 增加 元 素 w。 结 果 就 是 w 占 据 位 置 1， 取 代 了 原来 的 根 元 素 v。 


raise Subscript 


raise Subscript 
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新 树 的 右 子 树 〈 位 置 3, 5, …) 完全 就 是 旧 树 的 左 子 树 (位 置 2, 4, …)。 通 过 一 个 递归 调用 ， 新 
树 的 左 子 树 由 * 占 据 位 置 2， 并 将 旧 树 的 右 子 树 (位 置 3, 5, …) 剩 下 的 部 分 作为 新 树 的 左 子 树 。 


fun loext (Lf, w) = Br(w, Lf, Lf) 
| loext (Br(v,t1,t2), w) = Br(w, loext(t2,v), tl); 
> val loext = fn : ‘a tree * ‘a -> ‘a tree 


FILA BRAT AT OA Et AT Td AL AP aa ee Se E.R RR ARR T . 
试图 从 空 数组 里 删除 元 素 会 抛 出 标准 异常 Size。 形 如 Br(_, Lf, Br _) 的 树 是 不 需要 考虑 的 : EHE 
何 时 候 我 们 都 有 Z-1KR<Z， 其 中 Z 是 左 子 树 的 大 小 ，R 是 右 子 树 的 大 小 。 


fun lorem Lf 
| lorem (Br(_,Lf,Lf)) 


raise Size 


Lf 


| lorem (Br(_, tl as Br(v,_,_), 12)) Br(v, t2, lorem tl); 
> val lorem = fn : ‘a tree -> ‘a tree 
该 是 演示 的 时 候 了 。 通 过 从 一 个 叶子 开始 不 断 地 应 用 lioext， 我 们 创建 了 一 个 逆序 的 从 字母 A 到 
156| ”EE 的 数组 : 
loext (Lf, "A"); 


> Br ("A", Lf, Lf) : string tree 

loext (it, "B"); 

> Br ("B", Br ("A", Lf, Lf), Lf) : string tree 
loext (it, "C"); ` 

> Br ("C", Br ("B", Lf, Lf), Br ("A", Lf, Lf)) 
> : string tree 

loext (it, "D"); 

> Br ("D", Br ("C", Br ("A", Lf, Lf), Lf), 

> Br ("B", Lf, Lf)) : string tree 
val tlet = loext(it,"E"); 

> val tlet = Br ("E", Br ("D", Br ("B", Lf, Lf), Lf), 


> Br ("C", Br ("A", LË, Lf), Lt)) 
> : string tree 
树 tlet 看 上 去 是 这 样 的 : 


更 新 tlet 中 的 元 素 不 会 影响 这 个 数组 ， 不 过 建立 了 新 的 数组 : 


val tdag = update (update (tlet, 5, "Amen"), 
2, "dagger"); 

> val tdag = 

> Br ("E", Br ("dagger", Br ("B", Lf, Lf), Lf), , 
:> Br ("C", Br ("Amen", Lf, Lf), Lf)) 

> : string tree 
sub (tdag,5); 

> "Amen" : string 
sub (tlet,5); 

> "A" : string 
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这 个 二 又 树 在 每 个 操作 之 后 都 保持 平衡 。 对 于 下 标 为 k 的 元 素 ， 其 查询 和 更 新 的 时 间 和 log kK 
正比 ， 这 是 任何 没有 大 小 限制 的 数据 结构 所 能 达到 的 最 好 时 间 复 杂 度 。 访 问 一 百 万 个 元 素 的 
数组 所 需 的 时 间 是 访问 一 千 个 元 素 的 数组 的 两 倍 。 

标准 库 的 结构 4rray 提 供 了 命令 式 的 数组 。 它 们 将 在 第 8 章 用 来 实现 函数 式 (但 不 是 弹性 ) 
数组 。 如 果 用 命令 式 的 风格 使 用 数组 ， 那 么 该 实现 可 以 提供 常数 时 间 的 快速 访问 。 命 令 式 数 
组 是 非常 流行 的 ， 以 至 于 函数 式 的 应 用 需要 一 些 想像 力 。 

下 面 是 弹性 数组 的 签名 。 它 是 基于 结构 Array 的 ， 但 是 包括 了 扩展 和 删除 ， 既 有 从 下 端的 
(loext 和 lorem)， 也 有 从 上 端的 (hiext 和 hirem )。 


signature FLEXARRAY = 


sig 

type ‘a array 

val empty : array 

val length : array -> int 
val sub array * int -> 'a 


val loext array * 'a -> ‘a array 
val lorem : array -> ‘a array 

val hiext array * 'a -> ‘a array 
val hirem : array -> 'a array 
end; 


图 4-3 展 示 了 实现 。 基 本 的 树 操作 函数 被 包装 在 结构 Braun 中 ， 以 避免 与 结构 Flex 中 的 类 似 函 
数 发 生 名 字 冲 突 。 不 巧 的 是 ，Braun 里 面 的 下 标 范围 是 从 1 到 n， 而 Flex 的 下 标 则 是 从 0 到 n 一 1。 
前 者 是 来 自 数据 表示 方法 ， 后 者 则 是 ML 的 约定 。 

结构 Flex 将 弹性 数组 表达 为 二 叉 树 和 整数 的 序 偶 ， 其 中 ， 整 数 表示 了 数组 的 大 小 。 也 许 
可 以 将 类 型 array 声 明 为 类 型 缩写 : 


type ‘a array = ‘a tree * int; 


不 过 ， 实 际 上 却 将 array 声 明成 了 具有 一 个 构造 子 的 数据 类 型 。 这 种 数据 类 型 并 不 会 增加 运行 
时 的 开销 : 那个 唯一 的 构造 子 是 不 占 空间 的 。 这 个 新 的 类 型 将 弹性 数组 同 磁 巧 的 树 和 整数 的 
序 偶 区 分 开 来 ， 在 调用 Braun .sub 时 出 现 的 那个 序 偶 就 是 这 样 。 这 个 构造 子 在 结构 之 外 是 不 可 
见 的 ， 防止 了 使 用 者 将 一 个 弹性 数组 分 解 开 来 。 


‘a 
‘a 
‘a 
val update: 'a array * int * 'a -> 'a array 
‘a 
‘a 
‘a 
‘a 


Ci} 进一步 的 阅读 。Dijkstra (1976)， 是 一 本 经 典 的 关于 命令 式 程序 设计 的 著作 ， 
介绍 了 弹性 数组 和 很 多 其 他 概念 。Hoogerwoord (1992) 详细 叙述 了 婵 性 数组 ， 包 
括 从 下 误 扩 展 数 组 的 操作 。Okasaki (1995) 介绍 了 随机 访问 表 (random access list), 
它 既 有 对 数 时 间 的 数组 式 的 访问 ， 也 有 常数 时 间 的 表 操 作 (HE. AK. AA). 
随机 访问 表 是 由 一 组 完全 二 叉 树 的 列表 来 表示 的 。 它 的 代码 是 用 ML 写 的 ， 并 且 非 
常 易 懂 。 


练习 4.26 书写 一 个 函数 ， 创 建 一 个 其 下 标 位 置 从 1 到 n 都 是 含有 元 素 x* 的 数组 。 不 要 使 用 
Braun .update ， 直 接 创建 这 棵 树 。 


练习 4.27 书写 一 个 函数 将 由 元 素 x1, X … Xn (分 别 在 下 标 位 置 1 到 n) 组 成 的 数组 转换 成 一 
个 表 。 直接 对 树 进 行 操作 ， 而 不 是 反复 地 使 用 下 标 进行 操作 。 
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练习 4.28 通过 人 允许 空 标签 出 现在 树 中 来 实现 稀疏 数组 ， 这 种 数组 中 间 可 以 有 很 大 的 空隙 。 
















structure Braun = 
struct 

fun sub 

fun update ... 

fun delete 

fun loext 

fun lorem 

end; 





structure Flex : 
struct 
datatype ‘a array = Array. of ‘a tree * int; 


FLEXARRAY = 







val empty = Array(Lf,0); 








fun length (Array(_,n)) = n; 


fun sub (Array(t,n), k) = 
if 0<=K andalso k<n then Braun. sub(t,k+1) 
else raise Subscript; 











update (Array(t,n), k, w) = 
if 0<=k andalso k<n then Array (Braun .update(t,k+1,w), n) 
else raise Subscript; 


loext (Array(t,n), w) = Array(Braun.loext(t,w), n+1); 






lorem (Array(t,n)) = 
if n>0 then Array(Braun.lorem t, n-1) 
else raise Size; 


hiext (Array(t,n), w) = Array(Braun.update(t,n+1,w), n+1); 







hirem (Array(t,n)) = 
if n>0 then Array(Braun.delete(t,n) , n-1) 
else raise Size; 


图 4-3 Braun 树 和 弹性 数组 的 结构 


4.16 优先 队列 


158 优先 队列 (priority queue) 是 有 序 的 数据 项 集 。 数 据 项 可 以 以 任意 顺序 插入 ， 但 是 只 
159| 最 高 优先 级 的 项 可 以 被 访问 和 删除 。 传 统 上 较 小 的 数值 代表 了 较 高 的 优先 级 ， 所 以 有 关 的 基 
本 操作 叫做 insert( 插 入)、min (访问 最 小 项 ) 和 delmin (删除 最 小 项 )。 
在 仿真 中 ， 优 先 队 列 可 以 根据 调度 时 间 来 选 出 下 一 个 事件 。 在 人 工 智能 中 ， 优 先 队 列 实 
现 了 最 佳 优先 搜索 (best-first search): 对 一 个 问题 的 候选 解法 按 优先 级 别 来 存储 (由 一 个 评 
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估 函 数 给 每 个 解法 赋予 优 先 级 别 )， 最 好 的 候选 解法 被 选 出 来 进入 下 一 步 的 搜索 。 

如 果 优 先 队列 是 存放 在 排 好 序 的 表 中 ， 那 么 对 于 有 n 个 元 素 的 队列 ， 插 入 操作 最 坏 需 要 n 
步 。 这 会 慢 得 不 能 接受 。 通 过 二 又 树 ， 插 入 一 项 和 删除 最 小 项 只 需要 O(log n) 步 。 这 样 的 树 叫 
做 堆 (heap)， 是 著名 的 堆 排序 (heap sort) 算法 的 基础 。 树 中 标签 的 安排 要 满足 每 一 个 标签 
都 不 比 它 上 面 的 标签 小 。 这 个 堆 条 件 (heap condition) 并 不 能 使 得 标签 严格 按 顺 序 排列 ， 但 
是 一 定 会 将 最 小 的 标签 放 在 根 结 点 上 。 

传统 上 ， 这 棵 树 被 和 伐 在 一 个 数组 里 ， 标 签 是 如 下 图 那样 对 应 于 数组 下 标的 : 





7 项 的 堆 由 结 点 1 到 "组 成 。 这 种 索引 模式 总 是 建立 高 度 尽 可 能 小 的 树 。 不 过 我 们 的 函数 式 优先 
队列 是 基于 实现 弹性 数组 的 那 种 索引 模式 ; 它 似 乎 更 适合 函数 式 程序 设计 ， 并 且 也 保证 了 最 
小 高 度 。 最 后 得 到 的 程序 是 新 旧 思 想 的 混合 。 

如 果 堆 包含 n-1 个 项 ， 那 么 一 个 插入 项 将 填充 位 置 "。 但 是 ， 新 的 项 可 能 太 小 了 ， 不 能 在 
保持 堆 条 件 的 前 提 下 放 在 那个 位 置 上 。 它 可 能 最 后 占据 树 中 高 一 些 的 位 置 ， 追 使 比 它 大 的 项 
向 下 移动 。 函 数 insert 和 loext 的 原理 是 一 样 的， 只 不 过 在 插入 时 要 保持 堆 条 件 。 当 新 项 w 不 超 
过 当前 标签 v 时 ，w 会 取代 v 成 为 当前 标签 ， 而 把 v 往 下 插入 到 子 树 中 去 ; 因为 "不 会 比 子 树 中 的 
项 大 ， 所 以 w 也 不 会 。 

fun insert(w: real, Lf) = Briw, Lf, Lf) 

| insert(w, Br(v, tl, 12)) = 
if w <= v then Br(w, insert(v, 12), th) 
else Br(v, insert(w, (2), tl); 

> val insert = fn : real * real tree -> real tree 
看 上 去 没有 什么 简单 的 办 法 将 insert 操 作 倒 过 来 。 删 除 必须 去 掉 在 根 结 点 的 项 ， 因 为 它 是 最 小 
的 。 但 是 从 n 项 的 堆 中 删除 一 项 以 后 必须 空 出 位 置 +。 项 4 显然 可 能 太 大 ， 而 不 能 在 保持 堆 条 件 
的 前 提 下 放 进 根 结 点 。 因 此 ， 我 们 需要 两 个 函数 : 一 个 是 要 删除 项 x4， 另 一 个 是 将 它 的 标签 重 
新 插入 到 合适 的 位 置 。 

函数 lefrrem 和 Lorem 原 理 一 样 ， 但 是 并 不 会 将 标签 在 堆 中 上 下 移动 。 它 总 是 删除 树 最 左边 
的 一 项 ， 并 将 子 树 交 换 以 保持 堆 的 正确 形状 。 它 返回 被 删除 的 项 和 新 的 堆 所 组 成 的 序 偶 : 


fun leftrem (Briv,Lf,Lf)) = w, Lf) 
| leftrem (Br(v,tl,12)) = 
let val (w, t) = leftrem tl 
in (w, Br(v,?2,t)) end; 
> val leftrem = fn : ‘a tree -> ‘a * ‘a tree 


函数 sifrdown 用 被 转移 的 项 (lefirem 删 掉 的 项 ) 和 有 旧 堆 的 两 个 子 树 构造 一 个 新 堆 。 这 个 项 在 树 
中 向 下 移动 。 在 每 一 个 分 支 处 ， 它 转向 有 着 较 小 标签 的 那 棵 子 树 。 如 果 没 有 比 它 的 标签 还 小 
的 子 树 ， 就 停止 移动 了 。 我 们 要 感谢 这 个 索引 模式 ， 下 面 代 码 中 没 考虑 的 情形 是 不 可 能 发 生 
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的 。 如 果 左 子 树 是 空 的 ， 那 么 右 子 树 也 一 定 是 空 的 ; 如 果 布 子 树 是 空 的 ， 那 么 左 子 树 只 能 有 
一 个 结 点 。 


fun siftdown (w:real, Lf, Lf) 
| siftdown (w, t as Briv,Lf, Lf), Lf) 
if w <= v then Br(w, t, Lf) . 
else Bri(v, Br(w,Lf,Lf), Lf) 
| siftdown (w, tl as Br(vi,pl,ql), t2 as Br(v2,p2,q2)) = 
if w <= vl andalso w <= v2 then Br(w,fl,12) 
else if vi <= v2 then Br(vi, siftdown(w,p\,q\), 12) 
(*v2 < v1*) else Br(v2, tl, siftdown(w,p2,q2)); 
> val siftdown = fn 
> : real * real tree * real tree -> real tree 


现在 可 以 完成 删除 了 。 函数 deimmim 调 用 efzrem 来 删除 和 返回 一 项 ， 然 后 * 沪 down 把 这 项 放 回 一 
个 合适 的 位 置 。 从 空 的 堆 里 面 删除 是 错误 的 ， 并 且 要 单独 处 理 仅 有 一 项 的 堆 。 
fun delmin Lf 
| delmin (Br(v;Lf,_)) 
| delmin (Br(v,tl,t2)) 
let val (w,t) = leftrem tl 
in siftdown (w,t2,t) end; 
> val delmin = fn : real tree -> real tree 
为 优先 队列 而 定 的 签名 描述 了 上 面 讨论 的 基本 操作 。 它 也 描述 了 将 堆 和 表 相 互 转换 的 操作 ， 
以 及 相应 的 排序 函数 。 签 名 将 队列 里 面 的 项 的 类 型 描述 为 item; 目前 这 个 类 型 是 real， 不 过 一 
个 国 子 可 以 将 任何 有 序 的 类 型 作为 参数 (07.100). 


signature PRIORITY.QUEUE = 


Br(w,Lf,Lf) 


Hou 


raise Size 


Lf 


non on 


sig 

type item 

type 1 

val empty :it 

val null : t -> bool 
val insert : item * t -> t 
val min : £ -> item 
val delmin : t -> t 

val fromList : item list -> t 
val toList : t -> item list 
val sort : item list -> item list 
end; 


图 4-4 显 示 了 关于 堆 的 结构 。 它 给 空 堆 empty 和 谓词 nxlt 使 用 了 显然 的 定义 。 函 数 mi 只 是 简单 
地 返回 根 结 点 的 标签 。 

优先 队列 很 容易 就 实现 了 堆 排 序 。 将 表 排序 只 是 将 它 转 换 成 堆 然 后 再 转换 回来 。 函 数 
heapify 将 表 转换 成 堆 的 方法 使 我 们 想起 了 自 顶 向 下 的 合并 排序 (3.21 节 )。 这 个 方法 ， 通 过 
sifidown， 在 线性 时 间 内 将 堆 构 造 出 来 ; 反复 地 插入 则 需要 O(n log 刀 时 间 。 堆 排序 的 时 间 复 
杂 度 是 最 理想 的 ; 它 在 最 坏 的 情况 下 也 只 需要 O(n log 站 时 间 来 排序 n 个 项 目 。 实 践 中 ， 堆 排 
序 往往 比 其 他 的 O(n log 四 算法 要 慢 。 记 得 我 们 在 第 3 章 的 时 间 实验 ， 快 速 排序 和 合并 排序 可 
以 在 200 毫 秒 以 内 排序 10 000 个 随机 数 ， 但 是 Heap .sor! 则 要 500 毫 秒 。 
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structure Heap : PRIORITY.QUEUE = 
struct 
type item = real; 
type t = item tree; 


val empty = Lf; 


fun null Lf = true 
| null (Br _) = false; 


fun min (Br(v,_,_)) = v; 


fun insert 
fun leftrem 
fun siftdown ... 
fun delmin 


fun heapify (0, vs) (Lf, vs) 
| heapify (n, v::vs) 
let val (tl, vsl) = heapify (n div 2, vs) 
val (#2, vs2) = heapify ((n-1) div 2, vsl) 
in (siftdown (v,t1,12), vs2) end; 


fun fromList vs = #1 (heapify (length vs, vs)); 


fun toList (t as Br(v,_,_)) :: toList(delmin t) 
| toList Lf 


fun sort vs = toList (fromList 


end; 





图 4-4 利用 堆 实现 的 优先 队列 结构 


虽然 有 其 他 更 好 的 排序 方法 ， 但 是 堆 却 实 现 了 非常 理想 的 优先 队列 。 为 了 看 看 堆 是 怎样 
工作 的 ， 让 我 们 建立 一 个 堆 ， 并 从 中 删除 一 些 项 。 


Heap .fromList [4.0, 2.0, 6.0, 1.0, 5.0, 8.0, 5.0]; 


> Br (1.0, Br (2.0, Br (6.0, Lf, Lf), 

> Br (4.0, Lf, Lf)), 

> Br (5.0, Br (8.0, Lf, Lf), 

> Br (5.0, Lf, Lf))) : Heap.t 
Heap .delmin it; 

> Br (2.0, Br (5.0, Br (8.0, Lf, Lf), 

> Br (5.0, Lf, Lf)), 

> Br (4.0, Br (6.0, Lf, LE), Lf)) : Heap.t 


Heap .delmin it; 
> Br (4.0, Br (6.0, Br (8.0, Lf, Lf), Lf), 
> Br (5.0, Br (5.0, Lf, Lf), Lf)) : Heap.t 


我 们 看 到 最 小 的 项 被 首先 删除 。 我 们 再 应 用 两 次 delmin: 





162 
l 


124 


RAs 
Heap .delmin it; 
> Br (5.0, Br (5.0, Br (8.0, Lf, Lf), Lf), 
> Br (6.0, Lf, Lf)) : Heap.t 


Heap .delmin it; _ 
> Br (5.0, Br (6.0, Lf, Lf), Br (8.0, Lf, Lf)) : Heap.t 


ML 的 输出 被 适当 地 缩 进 以 突出 二 又 树 的 结构 。 


Ol 其 他 形式 的 优先 队列 。 这 里 展示 的 堆 有 时 又 叫做 二 又 (binary) BABA 
(implicit) 堆 。 像 Sedgewick (1988) 这 样 的 算法 课本 里 面 有 详细 的 叙述 。 其 他 传统 
的 优先 队列 的 表示 方法 也 可 以 进行 函数 式 的 编码 。 堪 倾 〈leftist) 堆 (Knuth, 1973, 
151 页 ) 和 二 项 式 堆 (Cormen¥, 1990, 400R) 要 比 二 又 堆 复 杂 得 多 。 但 是 它们 允 
许 两 个 堆 在 对 数 时 间 内 合并 。 二 项 式 堆 的 合并 操作 是 通过 一 种 二 进 制 加 法 来 进行 的 。 
Chris Okasaki 提 供 了 本 节 的 大 部 分 代码 ， 他 也 实现 了 很 多 其 他 形式 的 优先 队列 。 只 
不 要 求 合并 操作 ， 二 又 堆 就 是 最 简单 的 、 最 快 的 。 


练习 4.29 ”画图 表示 堆 的 创建 ， 从 空 堆 开始 ， 然 后 插入 4、2、6、1、5、8 和 5 (就 像 上 面 调 
用 Heap .fromList 用 的 那个 表 )。 


练习 4.30 ”通过 用 二 进 制 表 示 下 标 来 叙述 函数 式 数 组 的 索引 模式 。 同 样 叙述 传统 的 堆 排 序 的 
索引 模式 。 


练习 4.31 ”书写 函数 式 数组 的 查询 和 更 新 操作 ， 这 个 函数 式 数 组 要 基于 传统 的 堆 排序 的 索引 
模式 。 它 们 和 Braun .sub、Braun .update 比 较 怎 样 ? 


重 言 式 检测 器 


这 一 节 介 绍 基本 的 定理 证 明 。 我 们 定义 命题 和 将 其 转换 成 各 种 范式 的 函数 ， 由 此 得 到 一 
个 命题 逻辑 的 重 言 式 检测 器 。 我 们 不 再 使 用 二 又 树 ， 而 是 声明 一 个 关于 命题 的 数据 类 型 。 


4.17 命题 逻辑 


命题 逻辑 是 处 理 命题 (proposition) 的 ， 命 题 是 由 原子 a, b, c, … 通 过 连接 词 ^，v，“~ 构 成 。 
命题 可 以 是 


-p 否定 ,“ 非 p” 
prg 合 取 ,，“p 且 9” 
pya WR, “PRT 


命题 类 似 于 布尔 表达 式 ， 我 们 把 它 表示 为 数据 类 型 prop: 
datatype prop = Atom of string 
| Neg of prop 
| Conj of prop * prop 
| Di of prop * prop; 
itp 9 等 价 于 (~p)v 9 。 下 面 是 构造 蕴涵 的 函数 : 


fun implies(p,q) = Disj(Neg p. q); 
> val implies = fn : prop * prop -> prop 
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我 们 的 例子 基于 一 些 重要 的 属性 ， 它 们 是 富有 的 〈rich)、 有 土地 的 (landed) 和 圣洁 的 
(saintly ): 


val rich 
and landed 
and saintly 


Atom "rich" 
Atom "landed" 
Atom “saintly"; 


wou N 


下 面 是 对 于 富有 的 、 有 土地 的 和 圣洁 的 两 个 假设 。 
。 假 设 1 是 ianrded~ rich: 有 土地 就 会 富有 。 
。 假 设 2 是 -(saintly A rich): 一 个 人 不 可 能 既定 有 又 圣洁 。 
一 个 可 能 的 结论 是 landed 一 ~saintly: 有 土地 的 人 不 圣洁 。 
让 我 们 把 假设 和 和 希望 的 结论 输入 给 ML: 
val assumption! = implies (landed, rich) 


and assumption2 = Neg(Co (saintly, rich) ) ; 


> val assumptionl = Disj (Neg (Atom "landed"), 
> 


Atom "rich") : prop 
> val assumption2 = Neg (Conj (Atom "saintly", 
> Atom "rich")) : prop 


val concl = implies(landed, Neg saintly) ; 
> val concl = Disj (Neg (Atom "landed"), 
> Neg (Atom "saintly")) : prop 


如 果 可 以 从 假设 导出 结论 ， 那 么 下 面 的 命题 就 应 该 是 一 个 命题 的 定理 一 一 重 言 式 (tautology). 
让 我 们 来 把 它 声 明成 要 证 明 的 目标 : 

val goal = implies (Conj (assumption1 , assumption2) , concl) ; 

> val goal = 


> Disj (Neg (Conj (Disj (Neg (Atom "landed"), 
> Atom "rich"), 


> Neg (Conj (Atom "saintly", 
> Atom "rich")))), 
> Disj (Neg (Atom "landed"), Neg (Atom "saintly"))) 
> : prop 
用 数学 记 法 就 是 


(landed 一 rich} A -(saintly A richy) > (landed — ~ saintly) 
为 了 显示 更 具 可 读 性 的 结果 ， 我 们 来 声明 一 个 转换 命题 到 字符 串 的 函数 。 


fun show (Atom a) 
| show (Neg p) 
| show (Conj(p,q)) 


a 
wou A show p ^ njn 
"(n A show p ^ on & 1 人 show q A "ys 


| show (Disj (p,q)) "(" ^ show p ^" | " ^ show gq ^ ")"; 
> val show = fn : prop -> string 
下 面 是 我 们 的 证 明 目 标 : 
show goal; . 
> "((~((("landed) | rich) & (~(saintly & rich)))) 
> | (("landed) | (~saintly)))"  : string 


如 本 书 其 他 地 方 一 样 ， 我 们 插入 了 空格 和 换行 以 使 结果 更 清楚 。 
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练习 4.32 ”书写 另 一 个 版 本 的 snow， 去 掉 不 必要 的 括号 。 如 果 ”具有 最 高 优先 级 ， 而 v 具 有 
最 低 的 ， 那 么 ((=a)^ Bb)vc 中 的 所 有 括号 都 是 多 余 的 。 由 于 ^ 和 “满足 结合 律 ， 因 此 要 去 
掉 (a^b)A (cAd) 中 的 括号 。 

练习 4.33 ”书写 一 个 用 标准 的 真 值 表 来 计算 一 个 命题 的 函数 。 其 中 一 个 参数 应 该 是 取 值 为 真 
的 原子 的 列表 ， 其 他 的 原子 则 设 为 假 。 


4.18 否定 范式 
任何 命题 都 可 以 被 转换 成 否定 范式 (negation normal form) (NNF), HP ”只 应 用 在 原 
子 之 上 ， 这 可 以 通过 把 否定 推进 合 取 式 或 析 取 式 来 完成 。 重 复 地 进行 替换 
一 了 Pp 替换 成 P 

一 到 入 9) 替换 成 (~p) Y (q) 

~O V 9 替换 成 Op) A Oq) 
这 样 的 替换 有 时 也 称 作 重 写 规则 (rewrite rule )。 首 先 要 考虑 它们 对 不 对 。 规 则 有 歧义 吗 ? 没 
有 ， 因 为 规则 的 左边 概括 了 不 同 的 情形 。 替 换 会 最 终结 束 吗 ? 会 的 ， 虽 然 会 创建 新 的 否定 式 ， 
但 是 被 否定 的 部 分 缩小 了 。 我 们 怎么 能 知道 什么 时 候 停 下 来 呢 ?” 在 这 里 只 要 对 命题 扫描 一 遍 
就 足以 了 。 


函数 anf 原封 不 动 地 应 用 了 上 述 规则 。 当 某 种 情形 没有 适当 的 规则 时 ， 就 简单 地 进行 递归 
调用 。 


fun nnf (Atom a) Atom a 
| nnf (Neg (Atom a)) Neg (Atom a) 
nnf (Neg (Neg p)) nnf p 


nnf (Neg (Conj(p,q))) 


| 

| nnf (Disj (Neg p, Neg q)) 
| anf (Neg (Disj(p,q))) 

| 

| 


nnf (Conj(Neg p, Neg q)) 
nnf (Conj(p,q)) Conj (nnf p, nnf q) 
nnf (Disj(p,q@)) Disj (nnf p, nnf qQ); 

> val nnf = fn : prop -> prop 


假设 2， (saintly a rich) ， 被 转换 成 -saintlyv -rich 。 用 国 数 snow 显 示 转 换 结果 。 


nnf assumption2; 
> Disj (Neg (Atom "saintly"), Neg (Atom "rich")) : prop 


show it; 

> "((~saintly) | (rich))" : string 
函数 nnf 还 可 以 改进 。 给 定 (PAD, BRAM 

nnf(Disj(Neg p, Neg q)) 
求 值 ， 后 面 的 递归 调用 会 接着 计算 
Disj(nnf(Neg p), nnf(Neg q)) 

让 函数 在 此 情形 下 直接 对 这 个 表达 式 求 值 可 以 省 去 一 次 递归 调用 ， 同 样 的 改进 也 适用 于 “(PY 9)。 

它 还 可 以 更 快 。 用 另 一 个 函数 去 计算 nnfANeg p) 避 免 了 不 必要 的 否定 式 构 造 。 通 过 相互 弟 
归 ， 函 数 nanfpos 计 算 p 的 范式 ， 而 函数 nnfneg 则 计算 Neg p 的 范式 。 
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fun nnfpos (Atom a) 
nnfpos (Neg p) 
nnfpos (Conj (p,q)) 
nnfpos (Disj(p,q)) 
and nnfneg (Atom a) 
nnfneg (Neg p) 
nnfneg (Conj(p,q)) 
nnfneg (Disi(p,q)) 


Atom a 

nnfneg p 

Conj (nnfpos p, nnfpos q) 
Disj (nnfpos p, nnfpos q) 
Neg (Atom a) 

nnfpos p 

Disj (nnfneg p, nnfneg q) 
Conj (nnfneg p, nnfneg q); 


nou t uo AN 


419 合 取 范 式 


合 取 范 式 是 我 们 重 言 式 检测 器 的 基础 ， 也 是 定理 证 明 归 结 方法 的 基础 。 硬 件 设计 师 们 称 
它 为 布尔 表达 式 的 极 大 项 表示 。 

文字 (literal) 是 一 个 原子 或 原子 的 否定 式 。 当 一 个 命题 形 如 P1 ^… 人 ^ Pn 时 被 称 为 合 取 范 
A (conjunctive normal form) (CNFE)， 其 中 每 个 pi 都 是 文字 的 析 取 。 

要 检测 p 是 否 是 重 言 式 ， 把 它 简 化 成 CNE 命 题 。 现 在 ， 如 果 PAA Pn ERRANA, D 
么 p 也 是 重 言 式 ， 其 中 = 1, m. Bito nyyd, EPa, -o 9gn 都 是 文字 。 如 果 这 些 文 
字 里 面包 含 一 个 原子 和 它 的 否定 式 ， 那 么 p 就 是 重 言 式 。 否 则 这 些 原子 可 以 被 赋予 一 套 真 值 使 
得 p; 中 的 每 个 文字 都 为 假 ( 即 存在 成 假 指派 )， 故 p 就 不 是 重 言 式 。 

要 得 到 CNF， 我 们 先 从 命题 的 否定 范式 开始 。 利 用 分 配 律 、 不 断 将 析 取 推进 去 ， 直 到 析 
取 仅 应 用 于 文字 为 止 。 


PY (q Ar) 替换 成 pV gq) A(pV r) 
(gq Ar) Vp 替换 成 (g Vp) 八 (rv 了 p) 
这 些 赫 换 并 没有 产生 否定 范式 的 那些 来 得 直接 。 它 们 还 是 有 歧义 的 ， 两 条 规则 都 适用 
于 (aAb)v (cAd)， 所 得 的 范式 在 逻辑 上 却 是 等 价 的 。 赫 换 过 程 的 终止 是 有 保证 的 ， 虽 然 每 个 
替换 都 会 使 命题 增长 ， 但 是 却 把 一 个 析 取 替换 成 几 个 更 小 的 析 取 ， 这 个 过 程 不 可 能 永远 进行 
下 去 。 
一 个 析 取 式 可 能 包括 内 饼 的 合 取 式 ; 例如 av(bv(cAd)) 。 我 们 的 替换 策略 是 ， 给 


定 PY4 ,首先 把 p 和 4 转换 成 CNF。 这 使 得 任何 的 合 取 都 在 最 外 层 。 然 后 ， 应 用 上 面 的 替换 规 


则 ， 将 析 取 分 配 进 合 取 式 。 | 
调用 distrip(p, q) 计 算 析 取 式 Pv 4 的 CNF， 前提 是 p 和 4 都 是 CNF。 如 果 两 者 都 不 是 合 取 式 ， 
那么 结果 就 是 Pv 9 ， 这 是 仅 有 的 distrib 创 建 析 取 式 的 情况 。 其 他 情况 下 ， 它 将 析 取 分 配 进 合 
取 式 。 
fun distrib (p, Conj(q,r)) = Conj(distrib(p,q), distrib(p,r)-) 
| distrib (Conj(q,r), p) = Conj(distrib(q,p), distrib(r,p)) 
| distrib (p, q) = Dig(p,4) ~ 没有 合 取 式 *); 
> val distrib = fn : prop * prop -> prop 
前 两 个 情形 是 有 重 登 的 : 如 果 p 和 gq 都 是 合 取 式 ， 那 么 distrib(p, 9) 匹 配 第 一 种 情形 ， 这 是 因为 
ML 是 按 顺 序 进行 模式 匹配 的 。 这 是 一 种 自然 的 表达 函数 的 方法 。 我 们 可 以 看 到 ，distrib 从 参 
数 的 各 个 部 分 中 建立 了 所 有 可 能 的 析 取 : 
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distrib (Conj (rich, saintly), Conj (landed, Neg rich) ) ; 
> Conj (Conj (Disj (Atom "rich", Atom "landed"), 


> Disj (Atom "saintly", Atom "landed")), 

> Conj (Disj (Atom "rich", Neg (Atom “rich")), 

> Disj (Atom "saintly", Neg (Atom “rich")))) 
> : prop 

show it; 

> "(((rich | landed) & (saintly | landed)) & 

> ((rich | (“rich)) & (saintly | (“rich))))" : string 


pA94 的 合 取 范式 就 是 p 和 gq 分 别 的 合 取 范式 的 合 取 。 函 数 cnf 是 很 简单 的 ， 因 为 distrib 已 经 做 了 
大 部 分 的 工作 。 第 三 个 情形 是 为 了 捕 提 单独 的 Atom 和 Neg 的 。 


fun cnf (Conj(p,q)) = Conj (cnf p. cnf q) 
| cnf (Disj(p.q)) = distrib (cnf p, cnf q) 
| enf p =p (* 这 是 一 个 文字 *); 
> val cnf = fn : prop -> prop 


最 后 我 们 利用 cnf 和 nnf 来 将 要 证 明 的 目标 转换 成 CNF: 


val cgoal = cnf (nnf goal); 

> val cgoal = Conj (... ,... ) : prop 

show cgoal; 

> "((((landed | saintly) | ((~landed) | (~saintly))) & 
(((~rich) | saintly) | ((~landed) | (“saintly)))) & 
(((landed | rich) | ((~“landed) | (“~saintly))) & 
(((~rich) | rich) | ((“landed) | (“saintly)))))" 

: string 


这 是 个 不 折 不 扣 的 重 言 式 。 四 个 析 取 式 中 的 每 一 个 都 含有 某 个 原子 和 它 自己 的 否定 : 分 别 是 
landed、saintly、landed 和 rich。 为 检测 这 个 ， 函数 positives 返 回 了 一 个 析 取 式 中 的 正 原子 列表 ， 
而 函数 negatives 则 返回 了 否定 原子 的 列表 。 没 预测 到 的 情形 说 明了 命题 不 是 一 个 CNF; 这 时 
要 抛 出 异常 作为 结果 。 


exception NonCNF; 
fun positives (Atom a) [a] 
| positives (Neg {Atom _)} 0} 
| positives (Disj(p,q)) = positives p @ positives q 
| positives _ = raise NonCNF; 
> val positives = fn : prop -> string list 
fun negatives (Atom _) 0] 
| negatives (Neg (Atom a)) la] 
| negatives (Disj(p,q)) negatives p @ negatives q 
| negatives raise NonCNF; 
> val negatives = fn : prop ~> string list 


函数 taut 对 任 一 个 CNF 命 题 进行 重 言 式 检测 ， 利 用 了 inter ( 见 3.15 节 ) 来 形成 正 原子 和 否定 原 
子 集合 的 交集 。 最 后 的 结论 大 概 没 那么 有 意思 了 。 
fun taut (Conj(p,q)) taut p andalso taut q 


| taut p not (null (inter (positives p, negatives p))); 
> val taut = fn : prop -> bool 


vvv v 


rou ow fl 


taut cgoal; 
> true : bool 
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轿 | 先进 的 重 言 式 检测 器 。 上 面 公 述 的 重 言 式 检测 器 并 不 实用 。 有 序 二 又 决策 图 
(ordered binary decision diagram, OBDD) 可 以 通过 硬件 设计 来 解决 复杂 的 问题 。 它 
们 利用 了 有 向 图 ， 每 一 个 结 点 表示 了 一 个 “if-then-else” 决 策 。Moore (1994) Wik 
了 这 个 思想 和 关键 的 优化 办 法 ， 其 中 涉及 到 了 散 列 和 缓冲 技术 。 
Davis-Putnam 过 程 使 用 了 CNF。 它 可 以 解决 很 难 的 约束 满足 问题 ， 并 解决 了 一 些 
组 合 数学 中 的 开放 问题 。Zhang 和 Stickel (1994) 描述 了 一 个 可 以 用 ML 编码 的 算法 。 
Uribe 和 Stickel (1994) 也 讲述 了 对 这 个 过 程 和 OBDD 的 实验 性 的 比较 。 


练习 4.34 合 取 范式 命题 可 以 表示 为 文字 表 的 表 。 外 面 的 表 是 文字 的 合 取 ; 每 个 里 面 的 表 都 
是 文字 的 析 取 。 书 写 一 个 函数 将 命题 转换 成 这 种 表示 法 的 CNF。 


练习 4.35 ”改写 distribp 的 定义 ， 使 得 各 种 情形 没有 重 谷 。 


练习 4.36 ” 当 一 个 命题 形 如 PV…v Pp, 时 被 称 为 析 取 范式 (disjunctive normal form) (DNF), 
其 中 每 个 p; 都 是 文字 的 合 取 。 当 一 个 命题 的 否定 是 重 言 式 时 ， 这 个 命题 就 是 予 盾 的 
(inconsistent)。 叙 述 一 种 方法 利用 DNF 来 测试 一 个 命题 是 否 是 矛盾 的 。 用 ML 编写 这 个 方法 。 


要 点 小 结 


“数据 类 型 声明 是 通过 组 合 现 有 类 型 来 创建 新 类 型 的 。 

。 模式 是 由 构造 子 和 变量 构成 的 。 

。 异常 是 响应 运行 时 错误 的 一 般 机 制 。 

“递归 的 数据 类 型 声明 可 以 定义 树 。 

。 二 叉 树 可 以 表示 很 多 数据 结构 ， 包 括 字典 、 函 数 式 数 组 和 优先 队列 。 
* 模式 匹配 可 以 表达 逻辑 公式 的 变换 。 





第 5 章 ”函数 和 无 穷 数 据 


函数 式 程序 设计 中 最 有 力 的 技术 就 是 将 函数 作为 数据 看 待 。 大 多 数 的 函数 式 语 言 赋予 国 
数值 完整 的 功能 ， 没 有 强加 的 限制 。 就 像 其 他 种 类 的 值 一 样 ， 函 数 可 以 作为 别 的 函数 的 参数 
和 返回 值 ， 并 且 可 以 放 在 序 偶 、 表 和 树 里 面 。 

过 程式 语言 像 Fortran 和 Pascal 也 接受 这 种 思想 ， 只 要 编译 器 的 作者 们 觉得 方便 实现 。 函 数 
可 以 是 参数 : 比如 说 排序 中 的 比较 函数 ， 或 一 个 有 待 积 分 的 数值 函数 。 即 使 是 这 种 受 限制 的 
情形 也 是 很 重要 的 。 

如 果 一 个 图 数 是 作用 在 其 他 函数 上 的 话 ， 那 么 它 就 是 高 阶 的 (higher-order) (或 称 算 子 ， 
functional), ， 例 如 算 子 map 将 一 个 函数 应 用 到 表 中 的 每 个 元 素 上 ， 由 此 建立 一 个 新 表 。 足 够 丰 
富 的 算 子 集合 可 以 在 不 需要 变量 的 情况 下 表达 所 有 的 函数 。 算 子 可 以 用 来 构造 语法 分 析 器 
( 见 第 9 章 ) 以 及 定理 证 明 策 略 〈( 见 第 10 章 )。 

无 穷 表 ， 尼 的 元 素 在 需要 的 时 候 才 会 进行 求 值 ， 也 可 以 通过 把 函数 作为 数据 来 实现 。 一 
ARERR TAR. SIXT ARRAN SPEAR. THER ALAR 
的 ， 而 它 的 任何 有 限 数目 的 元 素 都 是 可 以 求 值 的 。 


本 章 提要 


前 半 部 分 讲述 了 把 函数 作为 数据 的 基本 程序 设计 技术 。 后 半 部 分 则 作为 扩展 提供 了 实践 
的 例子 。 惰 性 表 可 以 在 ML (虽然 有 严格 的 求 值 规则 ) 里 通过 函数 值 表 示 。 

本 章 包 括 以 下 几 节 : 

。 作 为 值 的 肖 数 。fn 记 法 可 以 表达 一 个 函数 而 无 须 将 其 命名 。 任 何 有 两 个 参数 的 函数 都 

可 以 表达 成 只 有 一 个 参数 的 “ 柯 里 ”函数 ， 这 个 函数 的 结果 是 另 一 个 函数 。 高 阶 函 数 的 

简单 例子 有 多 态 排 序 函 数 和 数值 算 子 。 

"通用 算 子 。 高 阶 函 数 式 程序 设计 的 内 容 很 大 程度 上 是 对 某 些 著名 算 子 的 使 用 ， 这 些 算 子 

是 操作 在 表 和 其 他 递归 数据 类 型 之 上 的 。 

“序列 (sequence)， 或 无 穷 表 。 本 章 通过 一 些 标准 的 例子 来 展示 在 ML 里 是 如 何 获得 惰性 

求 值 机 制 的 。 更 难 一 点 的 问题 是 将 多 个 整数 列表 的 列表 合并 成 一 个 整数 列表 ， 当 输入 的 

整数 列表 是 无 穷 表 时 ， 它 们 必须 被 合理 地 组 合 才能 不 丢失 任何 整数 。 

“搜索 策略 和 无 穷 表 。 一 个 搜索 问题 的 解 集合 有 可 能 是 无 穷 的 ， 这 样 的 解 集合 可 以 作为 无 

穷 表 来 产生 。 解 的 使 用 者 可 以 单独 设计 ， 使 得 它们 独立 于 解 的 生成 者 ， 这 样 解 的 生成 可 

以 不 受 限制 地 采用 任何 适当 的 搜索 策略 。 


作为 值 的 函数 


在 ML 里 面 函数 是 抽象 的 值 : 它们 可 以 被 创建 ; 可 以 被 应 用 到 参数 上 ; 可 以 成 为 其 他 数据 
结构 的 一 部 分 。 除 此 之 外 都 是 不 允许 的 。 函 数 是 由 模式 和 表达 式 给 出 的 ， 但 被 看 作 是 把 参数 
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转换 成 结果 的 “ 黑 盒 子 。 
5.1 使 用 fn 记 法 的 匿名 函数 


ML 的 函数 不 一 定 需要 名 字 。 如 果 x 是 一 个 变量 (具有 类 型 o)， 并 且 E 是 一 个 表达 式 (具有 
类 型 z) ， 那 么 表达 式 


fn x => E 


表示 了 一 个 具有 类 型 c~ ft 的 函数 。 函 数 的 参数 是 x， 函 数 体 是 E。 模 式 匹 配 也 是 允许 的 : 表 
达 式 


fn Pl => El | aan | Pa => En 
表示 了 由 模式 P, … P, 定 义 的 函数 。 它 和 下 面 的 let 表达 式 具 有 相同 的 含义 
let fun f(P) = 已 | = | f(Pa) = En in f end 


条 件 是 /不 能 出 现在 表达 式 E1, ..., E, 中 。fn 语 法 不 能 表达 递归 函数 。 
例如 ，fn n => n*2 是 一 个 将 整数 翻 倍 的 函数 ， 它 可 以 被 应 用 到 一 个 参数 上 ; 通过 val 声 
明 ， 也 可 以 给 它 命名 。 


(fn n=>n*2) (9); 

> 18 : int 

val double = fn n=>n*2; 

> val double = fn : int -> int 


很 多 ML 里 的 构造 都 是 通过 fn 记 法 来 定义 的 。 条 件 表 达 式 
if E then E, else = 

就 是 下 面 函数 应 用 的 缩写 
(fn true => E, | false => E) (E) 

分 情 表达 式 也 可 以 类 似 地 翻译 。 

练习 5.1 用 fn 记 法 表达 下 列 函 数 。 
fun square(x) : real = x*x; 


fun cons (x,y) = X::y; 


fun null 1] = true 
| null (_::_) = false; 


练习 5.2 ”修改 下 面 的 函数 定义 ， 用 val 声 明代 替 fun 声 明 。 


fun area (r) = pi*r*r; 

fun title(name) = "The Duke of " ^ name; 

fun lengthvec (x,y) = Math.sqrt(x*x + y*y); 
5.2 柯 里 函数 


函数 只 能 有 一 个 参数 。 迄 今 ， 有 多 个 参数 的 函数 是 把 它们 当 作 一 个 元 组 输入 的 。 多 个 参 
数 也 可 以 实现 为 一 个 函数 返回 另 一 个 函数 作为 结果 。 这 种 机 制 叫 做 柯 里 化 〈currying)， 是 根 
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据 罗 辑 学 家 H. B. Curry 命 名 的 。。 考 虚 下 面 的 函数 


fun prefix pre = 
let fun cat post = pre” post 
in cat end; 
> val prefix = fn : string -> (string -> string) 


如 果 使 用 fn 记 法 ，prefix 就 是 函数 
fn pre => (fn post => pre ^ post) 


给 定 一 个 字符 串 pre ， 国 数 prejfix 的 结果 是 另 一 个 函数 ， 这 个 函数 把 pre 连 接 在 它 自己 的 参数 之 
Ay. Gian, prefix "Sir" 是 函数 


fn post => “Sir " ^ post 
它 可 以 被 用 到 字符 串 上 : 


prefix "Sir "; 

> fn : string -> string 

it "James Tyrrell"; 

> "Sir James Tyrrell" : string 


省 略 六 ， 两 个 函数 应 用 可 以 同时 做 : 


(prefix "Sir ") "James Tyrrell"; 
> "Sir James Tyrrell" : string 


这 其 实 是 一 个 函数 调用 ， 其 中 的 函数 是 通过 表达 式 prefix "Sir" 计 算出 来 的 。 

请 注意 ，prefix 用 起 来 就 像 是 有 两 个 参数 的 函数 。 这 是 个 柯 里 函数 (curried function). 
假设 需要 声明 有 两 个 参数 的 函数 ， 参 数 类 型 分 别 为 m 和 办， 结果 类 型 是 zr， 现 在 我 们 有 两 种 途 
径 ， 一 个 是 作用 在 序 偶 上 的 函数 ， 具 有 类 型 (o x o)-t 另 一 个 是 柯 里 函数 ， 上 共有 类 型 ~ 


(o> T). 
柯 里 函数 允许 部 分 应 用 (partial application )。 应 用 到 它 的 第 一 个 参数 (具有 类 型 om) 时 ， 
结果 是 类 型 为 0 一 ?的 函数 。 这 个 函数 可 能 是 通用 的 : 比如 说 ， 用 于 称呼 所 有 的 骑士 。 


val knightify = prefix "Sir " 

> val knightify = fn : string -> string 
knightify "William Catesby"; 

> "Sir William Catesby" : string 
knightify “Richard Ratcliff"; 

> "Sir Richard Ratcliff" : string 


也 可 以 类 似 地 称呼 其 他 著名 的 历史 人 物 : 


val dukify = prefix "The Duke of "; 

> val dukify = fn : string -> string 
dukify "Clarence"; 

> "The Duke of Clarence" : string 
val lordify = prefix "Lord "; 

> val lordify = fn : string -> string 
lordify "Stanley"; ` 

> “Lord Stanley" : string 


日 ”这 个 方法 曾经 归功 于 Sch5nfinkel， 但 是 Schonfinkeling 一 词 从 未 流行 过 。 
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柯 里 函数 的 语法 。 上 面 的 函数 是 用 val 声 明 的 ,没有 用 fun。fun 声 明 必须 具有 显 式 的 参数 。 
对 于 柯 里 函数 来 说 ， 可 以 有 多 个 参数 ， 参 数 之 间 用 空白 隔 开 。 下 面 是 prehix 的 一 个 等 价 声明 : 


fun prefix pre post = pre” post; 
> val prefix = fn : string ~> (string -> string) 


函数 调用 具有 形式 E E,， 其 中 E 是 表示 函数 的 表达 式 。 由 于 
E E\E, + 是 (…((E EN)E2)…)E, 的 简写 
4 因此 ， 可 以 直接 书写 prefix "Sir" “James Tyrre1l1"， 而 不 用 括号 。 这 个 表达 式 是 从 左 到 右 
计算 的 。 
prefix 的 类 型 ，string 一 (string 一 string)， 可 以 省 上 略 其 中 的 括号: 符号 ~ 是 右 结合 的 
寺 轨 。 柯 里 函数 也 可 以 是 地 归 的 。 调 用 replisi nx 构造 了 一 个 由 a 个 < 的 持 中 所 构成 的 表 。 
fun replist n x = if n=0 then [] else x :: replist (n-1) x; 
> val replist = fn : int -> ʻa -> ’a list 


replist 3 true; 
> [true, true, true] : bool list 


即使 是 柯 里 化 ， 递 归 也 是 按照 通常 的 计算 规则 进行 的 。replis! 3 的 结果 是 函数 
fn x => if 3=0 then [] else x:: replist(3 —1)x 
将 它 应 用 到 true 上 面 产生 了 表达 式 
true :: replist 2 true 
随 着 计算 的 继续 ， 两 个 进一步 的 递归 调用 产生 了 
true :: true :: true :: replist O true 
最 后 的 调用 返回 nl， 因而 总 的 结果 是 [true, true, truel. 
O 和 数组 的 类 比 。 在 元 组 和 柯 里 化 之 间 的 选择 很 类 似 于 Pascal 中 的 二 维 数组 和 旋 讼 
数组 之 间 的 选择 。 
A: array [1..20, 1..30] of integer 
B: array [1..20] of array [1..30] of integer 
前 面 数组 的 下 标 形式 是 A[i, 首 ， 后 者 则 是 B[i[ 站 。 谍 套数 组 万 许 部 分 下 标 : Bi] 是 一 个 
一 维 数组 。9 


练习 5.3 下 面 的 几 个 柯 里 函数 的 部 分 应 用 的 结果 函数 分 别 是 什么 ? (不 要 在 机 器 上 试 。) 


fun plus i j : int = i+j; 

fun lesser a b : real = if a<b then a else b; 
fun pair x y = (x,y); 

fun equals x y = (x=y); 


练习 5.4 i PBA HOC RI LL Re AT 


fun f x y 
fun f x 


h (g x) y: 
h (8 x); 


© 4 #bPascal Mik BH SABA EAR ERAN SS, eee FAIBLE SERA. E 
者 在 这 里 显然 不 是 指 这 种 编译 器 。 一 一 详 者 注 “ 
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5.3 数据 结构 中 的 函数 


函数 和 具体 的 数据 类 型 在 数据 结构 中 扮演 了 互补 的 角色 。 表 和 树 构成 了 外 部 的 框架 并 将 
信息 组 织 起 来 ， 而 国 数 则 存储 了 可 能 的 计算 。 虽 然 函 数 在 计算 机 中 表示 为 有 限 长 的 程序 ,但 
是 我 们 却 经 常 可 以 把 它们 看 作 是 无 穷 对 象 。 

序 偶 和 表 可 以 包括 函数 作为 它们 的 分 量 : ” 


(concat, Math.sin); 

> (fn, fn) : (string list -> string) * (real -> real) 
[op+, op-, op*, op div, op mod, Int.max, Int.min); 

> [fn, fn, fn, fn, fn] : (int * int -> int) list 


在 数据 结构 中 存储 的 函数 可 以 被 取出 来 并 进行 应 用 。 


val titlefns = [dukify, lordify, knightify] ; 

> val titlefns = [fn, fn, fn] : (string -> string) list 
hd titlefns "Gloucester"; 

> "The Duke of Gloucester" : string 


这 是 一 个 柯 里 函数 调用 : hd tilejps 返 回 了 函数 duk 访 。 在 这 个 例子 中 ， 多 态 国 数 hd 具有 类 型 
(string > string) list > (string > string) 
一 棵 包含 函数 的 二 又 搜索 树 可 能 会 用 于 桌面 计算 器 程序 。 计 算 器 中 的 函数 可 以 用 名 字 来 寻找 。 


val funtree = Dict.insert (Dict.insert (Dict.insert (Lf, "sin", Math.sin), 
"cos", Math.cos), 
"atan", Maith.atan); 
val funtree = 
Br (("sin", fn}, 
Br (("cos", fn), Br (("atan", fn), Lf, Lf), Lf), 
Lf) : (real -> real) Dict.t 
Dict.lookup (funtree,"cos") 0.0; 
> 1.0: real 


vvvyv 


在 这 棵 树 中 存储 的 函数 必须 具有 相同 的 类 型 ， 这 里 是 rea1-~ rea!。 虽 然 不 同 的 类 型 也 可 以 组 合 
成 一 个 数据 类 型 ， 但 是 这 会 带 来 不 便 。 就 像 在 4.6 节 末 所 提 到 的 ， 类 型 exn 可 以 被 认为 包括 所 有 
的 类 型 。 上 面 函 数 的 一 个 更 为 灵活 的 类 型 就 是 exn list > exn。 


练习 5.5 在 上 面 的 例子 中 ， 多 态 函 数 Pict.lookup 共 有 什么 类 型 ? 


5.4 “作为 参数 和 结果 的 函数 


第 3 章 的 排序 函数 是 编写 成 对 实数 排序 的 。 通 过 把 比 序 谓词 (<) 作为 一 个 参数 ， 这 些 函 
数 可 以 被 推广 到 任意 的 有 序 类 型 。 下 面 是 插入 排序 的 多 态 消 数 : 


fun insort lessequal = 
let fun ins (x, [)) 
| ins (x, y: :ys) 
if lessequal(x,y) then x::y: :ys 
else y :: ims (x,ys) 


[x] 


fun sort [] = [] 


O Mil- FRR Pop Ht} aR Pe TT HE A A BB H. 
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| sort (x::xs) = ins (x, sort xs) 
in sort end; 
> val insort = fn 
> : (ʻa * ‘a -> bool) -> ʻa list -> ‘a list 


函数 ins 和 sort 是 在 局 部 定义 的 ， 它 们 引用 了 Iessequal。 虽 然 不 是 很 明显 ， 但 insorit 确 实 是 一 个 
柯 里 函数 。 给 定 具 有 类 型 zx Tt bool 的 参数 ， 它 返回 函数 sort:， 具 有 类 型 5 list 一 tlist。 用 于 比 
较 的 类 型 和 表 的 元 素 类 型 必须 一 致 。 

现在 整数 也 可 以 排序 了 。( 虽然 操作 符 <= 是 重 载 的 ， 但 是 整数 表 约 束 了 它 的 类 型 。) 


insort (op<=) [5,3,7,5,9,8); 
> [3, 5, 5, 7, 8, 9] : int list 


将 关系 > 作为 lessequal 传 入 则 返回 降序 排序 : 


insort (op>=) [5,3,7,5,9,8]; 
> (9, 8, 7, 5, 5, 3] : int list 


字符 串 序 偶 可 以 依照 字典 顺序 排序 : 


fun leq-stringpair ((a,b), (c,d): string*string) = 
a<c orelse (a=c andalso b<=d); 
> val leq_stringpair = fn 
> : (string * string) * (string * string) -> bool 


我 们 来 排序 (RE, 4%) 序 偶 的 表 : 


insort leq_stringpair 


[("Herbert","Walter"), ("Plantagenet", "Richard"), 
("Plantagenet", "Edward"), ("Brandon", "William"), 
("Tyrrell","James"), ("Herbert","John") J; 


> [("Brandon", "William"), ("Herbert", "“John"), 
> ("Herbert", "“Walter"), ("Plantagenet", "Edward"), 
> ("Plantagenet", "Richard"), ("Tyrrell", "“James")] 
> (string * string) list 
» D m-t . ` s 
函数 在 数值 计算 中 经 常 被 作为 参数 传递 。 下 面 的 算 子 计算 求 和 IO 。 为 了 效率 起 见 ， 它 
使 用 了 一 个 局 部 的 迭代 函数 来 引用 /和 mm 


fun summation f m = 
let fun sum (i,z) : real = 


if ism then z else sum (i+1, z+(f i)) 
in sum(0, 0.0) end; 
> val summation = fn : (int -> real) -> int -> real 


用 fn 记 法 可 以 很 好 地 和 算 子 配合 。 下 面 ， 在 计算 求 和 SO Ct, Ga TAP ERN 
声明 。 

summation (fn k => real(k*k)) 10; ` 

> 285.0 : real 
二 阶 求 和 Da Dagi 四 可 以 如 下 计算 


summation (fn i => summation (fn j => gli,j)) n) m; 
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这 相当 于 2- 记 法 的 ML 翻译 ;索引 变量 ;和 是 通过 fn 绑 定 的 。 内 求 和 》 eG. 四 是 i 的 一 个 函 
数 。 作 用 在 /上 的 函数 则 是 8 对 ;的 函数 部 分 应 用 。 

上 面 的 函数 部 分 应 用 还 可 以 简化 ， 利 用 柯 里 函数 记 取 代 8 来 作为 被 加 国 数 。 二 阶 求 和 
7 ni 可 以 如 下 计算 

summation (fn i => summation (h i) n) m; 
EENE, summation /有 具有 和 上 同样 的 类 型 ， 就 是 int-~ real， 因 此 DD SU) 可 以 通过 
summation (summation f) mit #. 

A 多 故 val 声 明 。 因 为 函数 可 以 是 一 个 计算 的 结果 ， 所 以 你 可 能 会 觉得 下 面 的 这 

些 声明 是 合法 的 : 


val listS = replist 5; 


> val list5 = fn : ‘a -> ’a list 
val f = hd [hd]; 
> val f = fn : ’a list -> ‘a 


在 早期 版 本 的 ML 中 它们 确实 是 合法 的 ， 但 是 现在 会 产生 一 个 类 似 “ 多 态 声 明 中 
有 不 为 值 的 项 ”。 的 信息 。 这 个 限制 和 引用 有 关 ， 在 8.3 节 有 详细 的 解释 。 将 函数 声明 
由 val f= EE 改 为 
funfx= Ex 
就 可 以 使 它 合法 了 。 这 个 改变 不 影响 什么 ， 除 非 计 算 E 会 产生 副作用 或 开销 很 大 。 

这 个 限制 会 影响 所 有 的 多 态 val 声 明 ， 而 不 仅仅 是 针对 济 数 的 。 应 该 记得 在 交互 
环境 顶层 输入 表达 式 E 相 当 于 输入 val it =E。 因 此 ， 举 例 来 说 ， 不 能 输入 hd [[]]。 


练习 5.6 书写 一 个 多 态 函 数 来 实现 自 顶 向 下 的 合并 排序 ， 将 比 序 谓词 (< ) 作为 参数 传 入 。 


练习 5.7 书写 一 个 算 子 来 计算 关于 函数 的 最 小 值 mint fG) ， 其 中 以 是 任意 给 定 的 正 整 数 。 
用 这 个 算 子 来 表达 二 元 最 小 值 minto minto 8g(i, 站 ，m 和 n 都 是 正 整 数 。 


通用 算 子 


函数 式 程序 员 通常 使 用 高 阶 函 数 来 清楚 简洁 地 表达 程序 。 处 理 表 的 算 子 在 Lisp 的 早期 就 
已 经 非常 普及 了 ， 而 且 有 着 无 数 的 变 体 和 各 种 名 称 。 一 些 操作 本 来 需要 单独 声明 递归 函数 ， 
而 通过 这 些 算 子 则 可 以 直接 表达 。 对 于 树 也 可 以 定义 类 似 的 递归 算 子 。 

一 个 全 面 的 算 子 集 相 当 于 一 种 可 以 表达 其 他 函数 的 抽象 语言 。 在 阅读 本 节 之 后 ， 你 会 发 
现 它 有 益 于 对 前 面 的 章节 进行 复习 ， 并 知道 如 何 使 用 算 子 来 简化 那些 函数 的 定义 。 


5.5 切片 


想像 一 下 将 中 缀 操作 符 只 应 用 在 一 个 操作 数 上 ， 或 左 或 右 ， 另 一 个 操作 数 空缺 。 这 定 
义 了 只 有 一 个 参数 的 函数 ， 称 为 切片 (section )。 下 面 是 使 用 Bird 和 Wadler (1988) 记 法 的 
例子 : 
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e ("Sir" 人 “^) 是 函数 knightify 
。(/2.0) 是 函数 “ 除 以 2” 


切片 可 以 通过 算 子 sec! 和 secr (相当 粗粮 地 ) 加 到 ML 中 : 


fun secl x f y = f(x,y); 
> val secl = fn : ʻa -> (ʻa * 'b -> ʻe) -> 'b -> 'c 
fun secr f yx = f(x,y); 
> val secr = fn: (’a * ‘b -> 'c) -> ‘b-> ‘a -> ‘Cc 


这 两 个 算 子 通常 和 中 缀 函数 以 及 op 一 起 使 用 ， 不 过 也 可 以 应 用 在 任何 具有 合适 类 型 的 函数 上 。 
下 面 是 几 个 左 切片 : 


val knightify = (secl "Sir " op”); 

> val knightify = fn : string -> string 
knightify "Geoffrey"; 

> "Sir Geoffrey" : string 

val recip = (secl 1.0 op/); 

> val recip = fn : real -> real 

recip 5.0; e 
> 0.2 : real 


下 面 是 一 个 右 切 片 ， 表 示 除 以 2: 


val halve = (Secr op/ 2.0); 

> val halve = fn : real -> real 
halve 7.0; 

> 3.5 : real 


练习 5.8 WA Ay EAR Z inl AA A? 
练习 5.9 下 面 的 切片 产生 的 函数 是 什么 ?回忆 一 下 take 的 作用 是 从 表 的 前 面 提取 元 素 (3.4 
节 )， 而 inter 的 作用 是 返回 两 个 表 的 交集 (3.157). 


secr op@ ["Richard"] 

secl {"heed", "of", "yonder", "dog!"] List.take 
secr List.take 3 

secl ["his", "venom", "tooth"] inter 


5.6 组 合子 


-演算 理论 中 的 一 部 分 与 被 称 为 组 合子 (combinator) 的 表达 式 有 关 。 很 多 组 合子 可 以 在 
ML 中 编写 成 高 阶 函数 ， 并 且 有 实际 的 应 用 。 
复合 。 中 缀 操作 符 o。( 没 错 ， 是 字母 “o”) 表示 了 函数 的 复合 。 标 准 库 中 将 它 声 明 为 : 


infix o; 
fun (f o g) x =f (x); 
> val o = fn: ('b -> 'c) * (fa -> 'b) -> ’a -> ‘Cc 


数学 家 对 复合 并 不 陌生 ; fo 8 是 一 个 国 数 ， 它 对 参数 首先 应 用 8 ， 然 后 应 用 /。 复合 可 以 表达 
很 多 函数 ,特别 是 利用 切片 。 例 如 ， 函 数 
fn x => ~(Math.sqrt x) 


fn a => "beginning" ^ a ^ "end" 
fn x => 2.0 / (x-1.0) 
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都 可 以 不 使 用 它们 的 形式 参数 来 表达 : 


~ o Math. sqrt 
(secl "beginning" op*) o (secr op” “end") 
{secl 2.0 op/) o (secr op- 1.0) 


为 了 计算 求 和 Y VK ， 函 数 Math.sqrt 和 转换 整数 到 实数 的 函数 real 被 复合 在 一 起 了 。 复 合 比 
fn 记 法 要 易 读 : 

summation (Math.sqrt o real) 10; 

组 合子 9$、K& 和 /1。 恒 等 组 合子 [， 只 是 返回 它 的 参数 : 


fun Ix = x; 
> val I = fn: ‘a -> ‘a 


将 函数 与 /复合 没有 任何 效果 : 
knightify o I o (prefix "William ") o I; 
> fn : string -> string ' 


it "Catesby"; 
> "Sir William Catesby" : string 


组 合子 K 创 建 常 函 数 。 给 定 x， 它 创建 了 一 个 总 是 返回 x 的 函数 : 


fun K x y = x; 
> val K = fn : ‘a -> ‘b -> ‘a 


为 了 演示 常 函数 ， 让 我 们 通过 黑 加 yz 来 计算 乘积 m x z: 


summation (K 7.0) 5; 
> 35.0 : real 


组 合子 5 是 函数 复合 的 一 般 形 式 : 


tunSxyz=xz (yz); 
> val S = fn: (’a -> ’b -> ‘c) -> ('a -> 'b) -> ‘a -> 'c 


ARR PERA eR BAB AT DA SAK RIA, AS oF EE fr] EK! David Turner (1979) 曾 
经 使 用 这 一 著名 的 事实 实现 了 情 性 求 值 : 因为 不 涉及 任何 变量 ， 所 以 不 需要 机 制 去 绑 定 它们 
的 值 。 事 实 上 ， 所 有 情 性 函数 式 语言 编译 器 都 利用 了 这 一 技术 的 某 种 改进 形式 。 

下 面 是 一 个 著名 的 例子 ， 它 展示 了 S$ 和 天 的 表达 能 力 。 恒 等 组 合子 [可 以 定义 为 8 天天 : 


S K K 17; 
> 17 : int 


练习 5.10 ” 写 出 9S KK 17 的 计算 步 又 。 


练习 5.11 假设 已 知 表达 式 E， 里 面包 含 中 缀 操作 符 、 常 量 和 变量 ， 其 中 有 变量 x 且 只 出 现 了 
一 次 。 叙 述 一 种 方法 来 表达 函数 fn x => E， 使 用 !， 切 片 和 复合 来 代替 fn 记 法 。 


5.7 表 算 子 map (了 映射) 和 filter (过 滤 ) 


算 子 map 将 一 个 函数 应 用 到 表 的 每 个 元 素 上 ， 返 回 由 所 有 结果 组 成 的 表 : 
map f [xi, ..., Xn] = [f Xi, ..., f Xn] 
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ML 程序 库 是 这 样 声明 map 的 : 


fun map f [] [] 
| map f (x::xs) (f x) :: map f xs; 
> val map = fn : (‘a -> 'b) -> ’a list -> ‘b list 
map recip [0.1, 1.0, 5.0, 10.0]; 
> [10.0, 1.0, 0.2, 0.1] : real list 
map size ["York", "Clarence", “Gloucester"]; 
> [4, 8, 10] : int list 


算 子 filter 将 一 个 谓词 《返回 布尔 值 的 函数 ) 应 用 在 表 上 ， 返 回 由 输入 表 中 所 有 满足 该 谓词 的 
元 素 组 成 的 表 ， 元 素 的 顺序 不 变 。 


fun filter pred [] = 
| filter pred (x::xs) = 
if pred x then x :: filter pred xs 
else filter pred xs; 
> val filter = fn : (‘a -> bool) -> ʻa list -> ‘a list 
filter (fn a => size a = 4) 
["Hie", “thee”, "to", "Hell", "thou”, "cacodemon"}; 
> ["“thee", "Hell", “thou"] : string list 


柯 里 函数 中 的 参数 模式 匹配 和 元 组 中 的 完全 一 样 。 上 面 两 个 算 子 都 是 柯 里 的 : map 接 受 类 型 为 
om 7 的 函数 作为 参数 ， 返 回 类 型 为 o list 一 tlist 的 函数 ， 而 fitter 则 接受 类 型 为 Tr- boot 函数 作为 
BR, RBA At list t listh AR. 


感谢 柯 里 化 ， 这 些 函 数 可 以 组 合 在 一 起 应 用 到 表 的 表 上 。 可 以 看 到 ，map(map f) [h, l, 
岂 将 map 应 用 到 每 一 个 表 , h, … 上 。 


map (map double) [{1], [2,3], [4,5,6]]; 
> [[2], [4, 6], [8, 10, 12]] : int list list 
map (map (implode o rev o explode) ) 

{("When", "he", "shall", "split"], 

{"thy", "very", "heart", "with", "sorrow"]]; 
> [{"nehw", "eh", "llahs", "tilps"], 
> f"yht", "yrev", "traeh", "htiw”, "worros"]] 
> : string list list 


oy 


类 似 地 ，map(filter pred) [h, h, ..., 将 filter pred 应 用 到 每 一 个 表 L1, L, ... 上 。 它 返回 了 满足 谓 
词 pred 的 元 素 所 组 成 的 表 的 表 。 


map (filter (secr op< “m")) 
{("my", "hair", "doth", "stand", "on", "end"], 
{"to", "hear", "her", "curses"]]; 
> [["hair", "doth", “end"], ["hear", "her", "curses"]] 
> : string list list 


很 多 表 的 函数 可 以 用 map 和 各 filter 简单 地 编写 出 来 。 我 们 的 矩阵 转 置 函 数 (3.959) 可 写成 


fun transp ([]::-) {) 
| transp rows map hd rows :: transp (map tl rows); 
> val transp = fn : ‘a list list -> ʻa list list 
transp (["have", "done", "thy", "charm"], 
("thou", "hateful", "withered", "hag!"}]; 
> [{"have", "thou"], ["done", “"hateful"], 
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> ["thy", "withered"], ["charm", "hag!"]] 
> : string list list 


回忆 一 下 我 们 在 3.15 节 是 怎样 利用 成 员 关 系 来 定义 两 个 “和 集合 ”的 交集 的 。 就 知道 这 个 声明 
可 以 简化 成 一 行 : 


fun inter(xs,ys) = filter (secr {op mem) ys) xs; 
> val inter = fn : ‘’a list * ’’a list -> ’’a list 


练习 5.12 说 出 怎样 将 形 如 
map f (map 8 xs) 
的 表达 式 替 换 成 只 调用 一 次 map 的 等 价 表达 式 。 [183 | 
练习 5.13 声明 中 缀 操作 符 andf， 使 得 
filter (predl andf pred2) xs 
返回 和 filter predl (filter pred2 xs) 同 样 的 值 。 
58 表 算 子 takewhile 和 dropwhile 
这 两 个 算 子 利用 一 个 谓词 从 表 中 截 出 一 个 初始 段 : 

[Xo sees Kil, Kis Ly] 

takewhile dropwhile 
其 中 ， 元 素 都 满足 谓词 的 初始 段 ， 是 由 takewhile 返 回 的 : 


fun takewhile pred [] [1 


| takewhile pred (x::xs) 


| 


if pred x then :: takewhile pred xs 
else []; 
> val takewhile = fn : (ʻa -> bool) -> ‘a list -> ‘a list 


剩 下 的 元 素 (如 果 有 的 话 ) 从 第 一 个 不 满足 谓词 的 元 素 开 始 ， 这 个 表 由 dropwhile 返 回 : 


fun dropwhile pred [} [] 
| dropwhile pred (x: :xs) 
if pred x then dropwhile pred xs 

else x: :xs; 


> val dropwhile = fn : (’a -> bool) -> ‘a list -> ‘a list 


这 两 个 算 子 可 以 处 理 作为 字符 列表 的 文本 。 谓 词 Char.is4pha 可 以 识别 一 个 字符 是 否 为 字母 。 
倘若 用 这 个 谓词 ，takewhile 可 以 从 一 个 句子 中 返回 第 一 个 单词 ， 而 dropwhile 则 返回 剩 下 的 字符 。 


takewhile Char.isAlpha (explode "that deadly eye of thine"); 

> (#"t", #"h", #"a", #"t"] : char list 

dropwhile Char .isAlpha (explode "that deadly eye of thine"); 
> [#" ", #"d", #"e", #"a", #"d", #91", ...] : char list 


由 于 两 个 算 子 都 是 柯 里 函数 ， 因 此 takewhile 和 dropwhile 可 以 和 其 他 算 子 组 合 。 例 如 ，map 
(takewhile pred) 返回 由 初始 段 组 成 的 表 。 


5.9 表 算 子 exists (FE) Mall (全 称 ) 
这 两 个 算 子 报告 表 中 是 否 有 一 些 (或 是 全 部 ) 元 素 满足 某 个 谓词 。 它 们 可 以 被 看 作 是 表 
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上 的 量词 : 


fun exists pred [] = false 

| exists pred (x::xs) = (pred x) orelse exists pred xs; 
> val exists = fn : (’a -> bool) -> ‘a list -> bool 
fun all pred [] = true 

| all pred (x::xs) = (pred x) andalso all pred xs; 
> val all = fn : ('a -> bool) -> ‘a list -> bool 


通过 柯 里 化 ， 这 两 个 算 子 将 一 个 作用 在 类 型 r 上 的 谓词 转换 成 作用 在 类 型 z list 上 的 谓词 。 成 员 
测试 函数 x mem xs 可 以 用 一 行 表达 : 


fun x mem xs = exists (secr op= xX) xS; 
> val mem = fn : ’’a * ‘’a list -> bool 


函数 disjoint 测 试 了 两 个 表 是 否 不 含 相同 的 元 素 : 


fun disjoint(xs,ys) = all (fn x => all (fn y => x<>y) ys) x$; 


> val disjoint = fn: ‘’a list * ’’a list -> bool ; 
由 于 参数 顺序 的 关系 exists Fall Ze HR BEIM HME BE ERRER, A ME disjointed EM 
试 “ 对 于 所 有 x 属于 xs 和 所 有 y 属 于 ys ，x 关 y”。 然 而 ，exists 和 all 与 其 他 算 子 结合 得 都 很 好 。 对 
于 表 的 表 ， 实 用 的 算 子 组 合 包括 : 
exists(exists pred) 
filter(exists pred) 
takewhile(all pred) 


5.10 表 算 子 foldl (AHH) 和 foldr (APP) 
这 两 个 算 子 具有 不 同 寻常 的 一 般 性 。 它 们 将 有 两 个 参数 的 晃 数 应 用 在 表 的 元 素 上 : 


foldl f e [xi,... ,xn] =fXn,... ,f(x1,e)...) 
foldr f e [x1,... , Xn] =f(x1,... fn, e)...) 


由 于 表达 式 是 从 内 到 外 计算 的 ， 因 此 /old 调用 将 f 从 左 到 右 地 应 用 在 表 的 元 素 上 ， 而 foldr 调 
用 则 从 右 到 左 地 将 函数 应 用 到 表 元 素 上 。 这 两 个 算 子 声明 为 


fun foldl f e [] =e 
| foldi f e (x::xs) = foldl f (f(x, e)) xs; 
> val foldl = fn : (ʻa * ‘b -> 'b) -> 'b -> ‘a list -> ‘b 
fun foldr f e 1 e 
| foldr f e (x::xs) = f(x, foldr f e xs); 
> val foldr = fn : ('a * 'b -> ’b) -> ‘b -> ‘a list -> ‘b 


很 多 函数 都 可 以 用 foldl 和 foldr 来 表达 。 表 元 素 的 求 和 可 以 通过 从 0 开始 反复 地 进行 加 法 来 
计算 : 


val sum = foldl op+ 0; 

> val sum = fn : int list -> int 
sum [1,2,3,4]; 

> 10 : int 
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而 乘积 则 通过 从 1 开始 反复 进行 乘法 来 计算 ， 我 们 并 不 需要 将 函数 事先 绑 定 到 一 个 标识 符 上 : 
foldl op* 1 {1,2.3,4]; 
> 24 : int 
这 些 定义 之 所 以 正确 ， 是 因为 0 和 1 分 别 是 + 和 x 的 单位 元 (identity element ) ， 换 名 话说， 对 
于 所 有 Kk 有 ，0 +K= 以 及 1 xk=k。 很 多 foldi 和 foldr 的 应 用 都 是 属于 这 个 类 型 的 。 
这 两 个 算 子 将 类 型 为 ox Tt 一 7 的 函数 作为 第 一 个 参数 。 这 个 函数 本 身 也 可 以 用 算 子 来 表达 、。 
KBE fold! oy LAH BAI AEA MM: 


foldi (fn (ns,n) => foldl op+ n ns) O [[1], [{2,3], [4,5,6]); 
> 21 : int 


这 比 sum (map sum [[1], (2,31, [4, 5, 6]]) 要 更 直接 ， 后 者 需要 构造 一 个 和 的 中 间 表 [1, 5, 15]. 
表 的 构造 函数 (操作 符 ::) 正好 具有 所 要 求 的 类 型 。 将 它 作为 foid! 的 参数 可 以 产生 一 个 高 
效 的 翻转 函数 : 
foldl op:: [] (explode "Richard"); 
> [#"a", #"r", #"a”, #"h", #"c", #"i", #"R"] : char list 
迭代 式 的 长 度 计 算 也 同样 简单 : 


foldl (fn (_,n) => n+1) 0 (explode "Margaret"); 
> 8: int 


要 将 xs 和 ys 连接 起 来 ， 可 以 从 ys 开始 ， 通 过 foldr 来 将 :: 应 用 到 xs 的 每 一 个 元 素 上 : 


foldr op:: {"out", "thee?") [*Ana", “leave"}; 
> ["And", "leave", "out", “thee?"] : string list 


通过 foldr 应 用 连接 操作 可 以 将 表 的 表 连 在 一 起 ， 就 像 函数 List. concat 那 样 。 注 意 ， 空 表 中 是 连 
接 操作 的 单位 元 : 

foldr ope [] {[1], [2,3], 14,5,6]]; 

> [1, 2, 3, 4, 5, 6] : int list 
回忆 一 下 ，newmem 向 表 中 增加 一 个 尚 不 在 其 内 的 元 素 (3.15 节 )。 通 过 foldr 应 用 该 函数 可 以 
构造 元 素 互 不 相同 的 “和 集合”: 

foldr newmem [] (explode "Margaret"); 

> [#"M", #"g", #"a", #"r", #"e", #"t"] : char list 
通过 应 用 基于 :: 和 了 的 函数 可 以 表达 map f: 

fun map f = foldr (fn(x,l)=> fx:: D [l]; 

> val map = fn : (’a -> ’b) -> ’a list -> ‘b list 
两 个 如 dr 调用 可 以 计算 两 个 表 的 币 卡 尔 乘积 : 


fun cartprod (xs, ys) = 
foldr (fn (x, pairs) => 
foldr (fn (y,l) => (x,y)::1) pairs ys) 
[l xs; 
> val cartprod = fn : ‘a list * ’b list -> (ʻa * ’b) list 


使 用 map 和 List.concat 可 以 更 为 清楚 地 计算 笛 卡 尔 乘 积 ， 代 价 是 要 建立 一 个 中 间 表 。 首 先 需 要 
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声明 一 个 柯 里 的 序 偶 函 数 : 


fun pair x y = (x,y); 
> val pair = fn: ‘a -> ‘b-> ‘a * ‘b 


然后 建立 序 偶 表 的 表 


map (fn a => map (pair a) ["Hastings","Stanley"]) 
[ "Lord", "Lady"]; 

> [[("Lord", "Hastings"), ("Lord", "Stanley")], 

> {("Lady", "Hastings"), ("Lady", "“Stanley")]] 

> : (string * string) list list 


sen 最 后 把 里 面 的 序 偶 表 连接 起 来 形成 笛 卡 尔 乘积 : 


List .concat it; 

> [("Lord", "Hastings"}), ("Lord", “Stanley"), 
> ("Lady", "Hastings"), ("Lady", "Stanley")] 
> : (string * string) list 


两 个 第 卡尔 乘积 的 算法 都 可 以 推广 ， 用 其 他 关于 x 和 y 的 函数 替换 (x, y)， 这 样 就 可 以 表示 形 如 
{f(x, y jx Exs, y Eys} 的 集合 了 。 


O 并 子 和 标准 库 。 中 组 操作 待 "， 用 于 函数 合成 ， 是 在 顶层 定义 了 的 。 在 顶层 还 有 
表 算 子 map、foldl 和 foldr， 它 们 同时 被 另行 声明 为 结构 List 的 组 件 ， 属 于 List 的 还 有 
filter、exists 和 all。 结 构 ListPair 提 供 了 map、exists 和 all 的 变 体 ， 它 们 接受 有 两 个 参 
数 的 函数 ， 并 操作 表 的 序 偶 。 例 如 ，ListPair .map 将 水 数 应 用 在 两 个 表 中 相应 元 康 所 
配 成 的 序 偶 上 : . 
ListPair.map f (ix. t.e., Xal» [yi e Yal) = (ft, yı), woof Ons ya)] 

如 果 表 的 长 度 不 一 ， 多 余 的 元 素 就 被 忽略 掉 了 。 同 样 的 结果 可 以 使 用 List.map 和 
ListPair .zip 来 得 到 ， 但 是 这 会 构造 一 个 中 间 表 。 

练习 5.14 利用 算 子 来 表达 并 集 函 数 union (3.1575). 

练习 5.15 利用 算 子 来 简化 矩阵 乘法 (3.1077). 

练习 5.16 利用 foldl 或 foldr 来 表达 exists。 

练习 5.17 利用 算 子 来 表达 集合 表达 式 


{x—y|xXExs,yEys,y <x} 


5.11 更 多 递归 算 子 的 例子 
二 又 树 和 类 似 的 递归 数据 类 型 可 以 利用 递归 算 子 来 处 理 。 甚 至 是 自然 数 0, 1, 2, … 也 可 以 
看 成 是 递归 数据 类 型 : 它们 的 构造 子 是 0 和 后 继 函 数 。 
函数 的 畴 。 如 果 f 是 一 个 函数 且 n>0， 那 么 f" 是 一 个 函数 ， 满 足 
FO = fo fF) 
i 


n 


下 面 是 函数 repeat fn: 
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fun repeat f n x = 
if n>0 then repeat f (n-1) (f x) 
else x; 
> val repeat = fn : (‘a -> ‘a) -> int -> ’a -> ‘a 


令 人 惊讶 的 是 ,许多 函数 都 具有 这 个 形式 。 这 方面 的 例子 包括 drop 和 replist (它们 分 别 是 在 
3.4 节 和 5.2 节 声明 的 ): 


repeat tl 5 (explode *I'11 drown you in the malmsey-butt..."); 


> [#"a", €or", #0", #"w", #"n", #" ", ...] : char list 
repeat (secl "Hat" op::) 5 []; 
> ["Ha!", "Ha!", "Hal", "Hai", "Ha!l"] : string list 


所 有 标签 都 是 同一 个 常量 的 完全 二 叉 树 可 以 这 样 构造 : 


repeat (fn t=>Br("No",t,t)) 3 Lf; 
> Br ("No", Br ("No", Br ("No", Lf, Lf), 


> Br ("No", Lf, Lf)), 
> Br ("No", Br ("No", Lf, Lf), 
> Br ("No", Lf, Lf£))) 
> 


: string tree 


重复 一 个 合适 的 序 偶 函 数 可 以 计算 阶乘 : 


fun factaux (k,p) = (k+1, k*p); 

> val factaux = fn : int * int -> int * int 
repeat factaux 5 (1,1); 

> (6, 120) : int * int 


树 的 递归 。 算 子 treefold， 对 于 二 又 树 来 说 ， 类 似 于 foldr。 调 用 /olar fe xs, 形象 地 说 ， 是 
把 表 中 的 :: 赫 换 成 了 以 及 把 ii 蔡 换 成 ce。 给 定 一 棵 树 ，treejold 将 每 个 叶子 替换 成 值 e 并 把 每 个 分 
支 替换 成 对 函数 的 应 用 ,ff 接受 三 个 参数 。 


fun treefold f e Lf =e 

| treefold f e (Br(u,tl,12)) = flu, treefold f e tl, treefold f e 12); 
> val treefold = fn 
>: (a * 'b * 'b -> 'b) -> 'b -> ‘a tree -> ‘b 


这 个 算 子 可 以 表示 上 一 章 很 多 关于 树 的 函数 。 函 数 size 将 每 一 个 叶子 都 奉 换 成 0 并 将 每 一 个 分 
支 替 换 成 一 个 将 1 加 到 子 树 大 小 上 去 的 函数 : 


treefold (fn(_,cl,c2) => 1+cl+c2) 0 
函数 depm 在 每 一 个 分 支 处 取 最 大 值 : 
.treefold (fn(_,d1,d2) => 1 + Int.max(di,d2)) 0 
调换 Br 的 两 个 子 树 的 函数 ， 通 过 树 的 递归 ， 就 定义 了 reflect (镜像 ): 
treefold (fn(u,tl,12) => Br(u,t2,tl)) Lf 
要 计算 前 序 表 ， 就 在 每 个 分 支 处 将 标签 和 对 应 于 子 树 的 表 连 接 起 来 : 
treefold (fn(u,ll,l2) => [u] @ 0 @ 2) [] 


关于 项 的 操作 。 项 (term) 的 集合 Xx, f(x), g(x, fx)), …，、， 是 通过 变量 和 函数 应 用 来 产生 的 ， 
这 与 ML 的 数据 类 型 是 相对 应 的 
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datatype term = Var of string 
| Fun of string * term list; 


项 (x + u) — O x x) 可 以 声明 为 

val tm = Fun("-", [Fun("+", [Var "x", Var "uu"]), 

Fun(**", [Var "y", Var "x"])]); 

虽然 用 ML 的 表 来 表示 函数 的 参数 是 非常 自然 的 ， 但 是 类 型 ierm 和 term list 必 须 被 看 作 是 相互 
递归 的 。 典 型 的 作用 于 项 上 的 函数 都 需要 使 用 与 之 配合 的 作用 在 项 列表 上 的 函数 。 幸 运 的 是 ， 
这 个 配合 函数 不 需要 另外 定义 ; 大 多 数 情况 下 它 都 可 以 利用 表 算 子 来 表达 。 

如 果 有 ML 函数 了 : string term 定 义 了 一 个 从 变量 到 项 的 殖 换 ， 那 么 下 面 的 subst /可 以 把 
这 个 替换 扩展 到 整个 项 中 的 所 有 变量 上 去 。 观 察 一 下 map 是 怎样 将 替换 应 用 到 项 列表 上 去 的 。 


fun subst f (Var a) =fa 
| subst f (Fun(a,args)) = Fun(a, map (subst f} args); 
> val subst = fn : (string -> term) -> term -> term 
项 中 所 有 变量 的 列表 也 可 以 通过 map 来 计算 : 
fun vars (Var a) = [a] 
| vars (Fun(.,args)) = List.concat (map vars args); 
> val vars = fn : term -> string list 
vars tm; 


> ["x", "u", "y", "*"] : string list 


这 个 办 法 有 点 浪费 ， 因 为 List.concat 不 断 地 将 表 来 回复 制 。 换 个 办 法 ， 声 明 函 数 accumVars， 
利用 一 个 额外 的 参数 来 积累 变量 表 。 这 个 函数 要 通过 foldr 来 扩展 到 项 列表 上 (积累 需要 两 个 
BR): 


fun accumVars (Var a, bs) 

| accumVars (Fun(_,args), bs) 
> val accumVars = fn : term 
accumVars (tm,1]); 


> ["x", "uu", "y", "x"] : string list 
下 面 是 替换 的 演示 。 一 个 简单 的 替换 函数 replace t a 将 名 为 a 的 变量 替换 成 项 :， 其 他 名 字 的 变 
量 则 不 变 : 


fun replace t a b = if a=b then t else Var b; 
> val replace = fn : term -> string -> string -> term 


Alt, subst (replace t a) xz 将 项 zx 里 面 所 有 名 为 的 变量 都 替换 成 了 项 +。 用 -z 替 换 掉 如 里 的 x 则 
产生 了 项 (-z+ 四 0- O x -2): 


subst (replace (Fun("-", [Var "z"])) "x*) tm; 
> Fun ("-", 


a: :bs 
foldr accumVars bs args; 
string list -> string list 


* R H 


> [Fun ("+", [Fun ("-", [Var "z"]), Var "u"]), 
> Fun ("*", [Var "y", Fun ("-", [Var "z2"])])l) 
> : term 

现在 变量 表 里 面 z 奉 代 了 原来 zx 的 位 置 : 


accumVars (it, (1); 
> ["z", "u", "y", "2"] : string list 
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练习 5.18 声明 算 子 prefold， 使 得 prefold f e t 等 价 于 foldr f e (preorder t). 
练习 5.19 ESAn, He Brepeat 中 可 以 计算 斐 波 那 契 数 。 
练习 5.20 下面 的 函数 有 什么 用 处 ? 
fun funny f 0 = 了 
| funny f n = if n mod 2 = 0 


then funny (f o f) (n div 2) 
else funny (f o f) (n div 2) of; 


练习 5.21 treefold FEN ARRO 其 中 FE 的 定义 如 下 : 
fun F (v,f1,f2) vs = v :: fl (f2 vs); 


练习 5.22 考虑 对 项 中 的 Fun 结 点 进行 计数 。 首 先 使 用 vars 模 式 来 表达 这 个 函数 ， 然 后 使 用 
accumVars 模 式 ， 最 后 不 要 使 用 算 子 来 表达 这 个 函数 。 


练习 5.23 ”注意 vars tm 的 结果 中 出 现 了 两 次 x。 书 写 一 个 函数 来 计算 一 项 中 没有 重复 的 变量 
表 。 利 用 算 子 ， 你 能 否 发 现 一 个 简单 的 办 法 呢 ? 


序列 ， 或 无 穷 表 


惰性 表 是 函数 式 程序 设计 最 著名 的 特性 之 一 。 情 性 表 中 的 元 素 直 到 程序 的 其 他 部 分 需要 
时 才 会 被 计算 ; 因此 情 性 表 可 以 是 无 穷 的 。 在 惰性 求 值 的 语言 如 Haskell 中 ， 所 有 的 数据 结构 
都 是 惰性 求 值 的 ， 并 且 无 穷 表 在 程序 中 很 常见 。 在 ML 中 ,计算 是 严格 的 ， 无穷 表 就 很 少见 了 。 
这 一 节令 述 了 在 ML 中 怎样 表达 无 穷 表 ， 通 过 一 个 函数 表示 表 尾 来 延 时 对 它 的 求 值 。 

认识 用 无 穷 表 进行 程序 设计 的 害处 也 是 很 重要 的 。 迄 仿 ， 我 们 都 是 希望 每 个 销 数 ， 从 最 
大 公 因 子 到 优先 队列 ， 都 能 在 有 限时 间 内 得 到 结果 。 递 归 被 用 于 将 问题 简化 成 更 简单 的 子 问 
题 。 每 个 递归 函数 都 包括 一 个 基本 情形 ， 在 那儿 函数 可 以 停 下 来 。 i 

现在 需要 处 理 潜在 的 无 穷 结果 。 我 们 可 以 看 到 无 穷 表 的 任何 有 穷 部 分 ， 但 想 看 到 全 部 是 
不 可 能 的 。 可 以 通过 依次 将 两 个 无 穷 表 的 元 素 相 加 来 取得 和 的 表 ， 但 是 不 能 翻转 无 穷 表 或 找 
到 其 中 最 小 的 元 素 。 这 里 将 要 定义 无 穷 进 行 而 没有 基本 情形 的 递归 函数 。 我 们 不 再 询问 程序 
能 否 停止 运行 ， 而 只 能 问 程 序 的 每 个 有 穷 部 分 能 否 在 有 限时 间 内 产生 。 

ML 中 作用 在 无 穷 表 上 的 函数 要 比 在 惰性 求 值 语言 中 的 相应 函数 复杂 。 然 而 ， 通 过 将 运行 
机 制 暴 露出 来 ， 可 以 帮助 我 们 避免 一 些 缺 陷 。 从 运行 机 制 方面 来 思考 应 该 不 是 唯一 的 办 法 ， 
而 在 无 穷 值 上 进行 的 计算 可 能 会 超出 我 们 的 想像 力 。 论 域 理 论 (domain theory) 给 出 了 关于 
这 种 计算 的 更 为 深入 的 观点 (Gunter, 1992; Winskel, 1993). 


5.12 序列 类 型 


无 穷 表 传统 上 称 为 流 (stream)， 不 过 这 里 我 们 将 其 称 为 序列 (sequence)。(“ 流 ”在 ML 
中 指 一 个 输入 输出 通道 )。 和 表 一 样 ， 序 列 或 者 是 空 的 ， 或 者 是 包含 头 和 尾 的 。 空 序列 是 Nil， 
而 非 空 序列 具有 形式 Cons(x, x 及 ， 其 中 x 是 头 ，xyY 是 计算 尾 的 函数 : 9 


佰 、 单 元 类 型 unit 在 28 东 有 叙述 。 
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datatype ‘a seq = Nil 
| Cons of ‘a * (unit -> ‘a seq); 

从 这 个 声明 开始 ， 我 们 将 通过 和 表 进 行 类 比 来 交互 地 开发 一 套 序列 的 基本 操作 。 稍 后 ， 为 了 
避免 名 字 冲 突 ， 将 把 它们 组 织 到 一 个 恰当 的 结构 中 去 。 

返回 头 和 尾 的 函数 很 容易 声明 。 和 表 一 样 ， 检 查 到 空 序列 时 应 该 抛 出 一 个 异常 : 

exception Empty; 

fun hd (Cons(x,xf)) = x 

| hd Nil = raise Empty: 

> val hd = fn : ‘a seq -> ‘a 
为 了 检查 序列 尾 ， 将 函数 xf 应 用 到 () 上。 这 个 参数 是 单元 类 型 unit 唯 一 的 值 ， 不 传递 任何 信息 ， 
它 仅 仅 是 迫使 对 序列 尾 进行 求 值 。 

fun tl (Cons(x,xf)) = 不 () 


| tl Nil raise Empty; 
> val tl = fn : ‘a seq -> ‘a seq 


调用 cons(x, xg) 将 头 z 和 尾 序列 xzg 合 并 到 一 起 组 成 一 个 更 长 的 序列 : 

fun cons(x,xq) = Cons(x, fn()=>xq); 

> val cons = fn : ‘a * ‘a seq -> ’a seg 
TER, con, E) 并 不 是 惰性 求 值 的 。ML 对 表达 式 E 求 值 ， 得 到 结果 xqg， 并 返回 Cons(x, fn () 
=> xq)。 所 以 在 cons 里 面 的 fn 并 没有 对 序列 尾 的 求 值 进 行 延 时 。cons 只 能 用 在 不 需要 情 性 求 值 
的 地 方 ， 例 如 将 一 个 表 转 换 成 序列 : l 


fun fromList | = List.foldr cons Nil 1; 
> val fromList = fn : ‘a list -> ‘a seq 


要 想 延迟 对 E 求 值 ， 直 接 写 Cons(x, fn 0 => EE) 代 赫 cons(x, BE). IER ESAKI RE H 
数 序列 : 

fun from k = Cons(k, fn()=> from(k+1)); 

> val from = fn : int -> int seq 

from 1; 

> Cons (1, fn) : int seq 


这 个 序列 从 1 开始 ， 下 面 是 另外 几 个 例子 : 
tl it; 
> Cons (2, fn) : int seq 
tl it; 
> Cons (3, fn) : int seq 


调用 take(xq, n) 取 得 序列 xq 的 前 n 个 元 素 作 为 表 返 回 : 
fun take (xq, 0) [] 


| take (Nil, n) = raise Subscript 
| take (Cons(x,xf), n) = x :: take (xf(), n-1); 
> val take = fn : ‘a seq * int -> ‘a list 


take (from 30, 7); 
> [30, 31, 32, 33, 34, 35, 36] : int list 


计算 是 怎样 进行 的 呢 ? 计算 iaekeWiom 30, 2) 是 这 样 进行 的 : 
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take(from 30, 2) 
=> take(Cons(30, £n () =>from(30 + 1)), 2) 
"=> 30 :: take(from(30 + 1), 1) 
=> 30 :: take(Cons(31, £n ( ) =>from(31 + 1)), 1). 
=> 30 :: 31 :: take(from(31 + 1), 0) 
=> 30 :: 31 :: take(Cons(32, £n ( ) =>from(32 + 1)), 0) 
=> 30:31: 0 
= [30, 31] 


可 以 看 到 元 素 32 被 计算 了 ， 但 却 没 有 用 到 。 类 型 a seq 并 不 是 真正 延 时 ， 非 空 序列 的 头 总 是 会 

被 预先 计算 。 更 精 的 是 ， 重 复 地 检查 序列 尾 导 致 对 其 重复 计算 ， 我 们 没有 传 需 调用 ， 只 有 传 [193] 
名 调用 。 通 过 增加 额外 的 复杂 性 作为 代价 ， 这 些 缺 陷 是 可 以 改进 的 (8.4 节 )。 

练习 5.24 ”解释 下 面 版 本 的 /rom 错 在 哪里 ， 令 述 take(badfrom 30, 2) 的 计算 步骤 。 


fun badfrom k = cons(k, badfrom(k+1)); 


练习 5.25 下面 的 a seq 变 种 将 所 有 非 空 序列 表示 为 一 个 函数 ， 防 止 了 过 早 地 对 首 元 素 进行 计 
算 (Reade，1989， 第 324 页 )。 为 这 种 类 型 的 序列 编写 函数 /rom 和 take: 


datatype ‘a seq = Nil 
| Cons of unit -> ‘a * 'a seq; 


练习 5.26 下面 的 a seg 变 种 ， 通 过 相互 递归 进行 声明 ， 比 上 面 的 更 具 惰 性 。 所 有 序列 都 是 国 
数 ， 甚 至 判断 序列 是 否 为 空 所 需 的 计算 都 被 延 时 了 。 为 这 种 类 型 的 序列 编写 函数 /rom 和 take: 
= Nil 

| Cons of ‘a * ‘a seq 

= Seq of unit -> ‘a seqnode; 


datatype ‘a seqnode 


and 'a seq 


5.13 基本 的 序列 处 理 


为 了 使 基于 序列 的 函数 可 计算 ， 输 出 的 每 个 有 穷 部 分 都 必须 仅 依赖 于 输入 的 某 一 有 穷 部 
分 。 沽 虑 将 序列 里 的 整数 依次 地 进行 平方 。 在 对 输出 序列 的 尾部 进行 求 值 时 ， 需 要 将 squares 
应 用 于 输入 序列 的 尾部 。 


fun squares Nil : int seq = Nil 
| squares (Cons (x,xf)) = Cons(x*x, fn()=> squares (xf())); 
> val squares = fn : int seg -> int seq 
Squares (from 1); 
> Cons (1, fn) : int seq 
take (it, 10); 
> [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] : int list 


将 两 个 序列 的 对 应 元 素 相 加 也 是 类 似 的 。 对 输出 的 尾部 求 值 时 会 去 对 两 个 输入 的 尾部 求 值 。 
只 要 有 一 个 输入 序列 为 空 时 ， 输 出 就 为 空 。 [194] 


fun add (Cons(x,xf), Cons(y,yf)) = Cons{x+y, 


fn()=> add(xf(), yf())) 
| add _ : int seq = Nil; 
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> val add = fn : int seq * int seq -> int seg 
add (from 10000, squares (from 1)); 

> Cons (10001, fn) : int seq 

take (it, 5); 

> (10001, 10005, 10011, 10019, 10029] : int list 


序列 的 追加 函数 和 表 的 类 似 。xg @ yg 的 元 素 首先 从 xg 中 提取 ; 当 xg 为 空 时 ， 就 改 为 从 yg 中 


提取 。 
fun Nil @ yq = yg 
| (Cons(x,xf)) @ yq = Cons(x, fn()=> (f()) @ yq); 
> val @ = fn: ‘a seq * ’a seq -> ’a seg 


为 了 进行 一 个 简单 的 演示 ， 让 我 们 用 /romList 建 立 一 个 有 穷 序 列 。 


val finite = fromList (25,10); 

> Cons (25, fn) : int seq 
finite @ from 1415; 

> Cons (25, fn) : int seq 
take (it, 3); 

> [25, 10, 1415] : int list 


如 果 xg 是 无 穷 的 ， 那 么 xg @ yg 就 等 于 xg。 追 加 函数 的 一 个 变种 可 将 两 个 无 穷 序列 均匀 地 合 在 
一 起 。 两 个 序列 的 元 素 可 以 交 普 (interleaved) 存放 : 
fun interleave (Nil, yq) = 
| interleave (Cons(x,xf), yq) = 
Cons(x, fn()=> interleave(yq, xf())); 
> val interleave = fn : ‘a seq * ‘a seq -> ‘a seq 
take (interleave (from 0, from 50), 10); 
> [0, 50, 1, 51, 2, 52, 3, 53, 4, 54) : int list 


在 递归 调用 中 ，interieave 将 两 个 序列 进行 交换 ， 使 得 任何 一 个 都 不 能 把 另 一 个 排除 在 外 。 
序列 的 算 子 。 像 map 和 filter 这 样 的 表 算 子 也 可 以 推广 到 序列 上 。 函 数 sguares 就 是 算 子 map 
的 一 个 例子 ， 它 将 一 个 函数 应 用 到 序列 的 每 一 个 元 素 上 : 


Yq 


fun map f Nil Nil 


| map f (Cons(x,xf)) = Cons(f x, fn()=> map f Of (0)); 
> val map = fn : (‘a -> 'b) -> ‘a seq -> ’b seq 


为 了 过 滤 一 个 序列 ， 需 要 连续 调用 尾 函 数 直到 发 现 满足 给 定 谓词 的 元 素 为 止 。 如 果 没 有 这 样 
的 元 素 ， 计 算 就 不 会 停止 。 


fun filter pred Nil 
| filter pred (Cons (x,xf)) 
if pred x then Cons(x, fn()=> filter pred (xf())) 
else filter pred (xf()); 
> val filter = fn : (ʻa -> bool) -> ‘a seq -> ‘a seq 
filter (fn n => n mod 10 = 7) (from 50); 
> Cons (57, fn) : int seq 
take (it, 8); 
> [57, 67, 77, 87, 97, 107, 117, 127] : int list 


函数 六 om 是 算 子 iterates 的 一 个 例子 ， 它 生成 一 个 形 如 E, fx), KA), CX), ERS: 


Nil 


tt 
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fun iterates f x = Cons{x, £n()=> iterates f (f x)); 


> val iterates = fn: (‘a -> ʻa) -> ‘a -> ‘a seq 
iterates(secr op/ 2.0) 1.0; 

> Cons (1.0, fn) : real seq 

take (it, 5); 


> (1.0, 0.5, 0.25, 0.125, 0.0625] : real list 


序列 结构 。 让 我 们 再 把 刚才 探讨 过 的 几 个 函数 凑 在 一 起 做 成 一 个 结构 。 就 像 在 二 又 树 结 
构 中 一 样 (4.13 节 )， 把 数据 类 型 声明 留 在 外 面 ， 这 样 可 以 直接 引用 构造 子 。 现 在 假设 其 他 的 
序列 林 本 函数 没有 在 顶层 声明 ， 而 是 在 结构 Seg 中 声明 的 ， 它 满足 下 面 的 签名 : 


signature SEQUENCE = 
sig 


exception Empty 

val cons ‘a * 'a seq -> 'a seq 

val null ‘a seq -> bool 

val hd ‘a seq -> 'a 

val ul ‘a seq -> 'a seq 

val fromList ‘a list -> 'a seq 

val toList ‘a seq -> ‘a list 

val take ‘a seq * int -> ‘a list 

val drop ‘a seq * int -> 'a seq 

val @ ‘a seq * 'a seq -> 'a seq 

val interleave : 'a seq * 'a seq -> ‘a seq 

val map : (‘a -> 'b) -> 'a seq -> 'b seq 
val filter : (‘a -> bool) -> ‘a seq -> 'a seq 
val iterates : (ʻa -> 'a) -> 'a -> 'a seq 
val from : int -> int seq 

end; 


练习 5.27 声明 尚 缺 的 函数 null 和 drop， 类 比 表 的 相应 函数 。 同 时 声明 toList 来 将 有 穷 序 列 转 
换 成 表 。 


练习 5.28 说 明 add(from 5, squares(from 9)) 的 计算 步骤 。 


练习 5.29 ”声明 一 个 函数 ， 对 于 给 定 的 正 整 数 k， 将 序列 [x, x2,.…] 转 换 成 一 个 新 的 序列 ， 其 
中 原 序 列 的 每 个 元 素 在 新 序列 中 重复 次 : 


练习 5.30 ”声明 一 个 函数 来 将 序列 中 相 邻 的 元 素 相 加 ， 即 将 序列 [x1, x2, ,Xx4，.…] 转 换 成 序列 


[x + Xo, X3 + X4, alo 
练习 5.31 在 表 算 子 takewhile、dropwhile、exists 和 all 中 ， 哪 一 个 或 哪 几 个 可 以 合理 地 推广 
到 无 穷 序 列 中 去 ? 编写 那些 可 以 推广 的 ， 并 解释 那些 不 能 推广 的 算 子 有 何不 妥 。 
5.14 基本 的 序列 应 用 

我 们 可 以 利用 Segq 结 构 来 找 零钱 、 表 示 随 机 数 的 无 穷 序 列 以 及 枚 举 素数 。 下 面 举 几 个 例子 
来 重点 说 明 序 列 算 子 。 


再 议 找 零钱 问题 。 国 数 alIChange (3.745) 算出 了 所 有 可 能 的 找 零钱 方法 。 这 很 不 实用 : 
如 果 是 用 英国 硬币 的 话 ， 一 共有 4366 种 方法 来 找 99 便 士 ! 
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ML 中 得 到 希望 的 效果 就 需要 注意 了 。 仅 仅 是 将 aiChanrge 中 的 表 操作 替换 成 序列 操作 几乎 没 
什么 用 。 新 函数 会 包含 两 个 递归 调用 ， 没 有 任何 东西 可 以 延迟 第 二 个 调用 的 执行 ， 因 此 结果 
序列 还 是 会 被 完全 计算 出 来 。 


Seq.@ (allChange(c::coins, c::coinvals, amount-c) , 
allChange (coins, coinvals, amount) ) 


更 好 的 办 法 是 从 练习 3.14 的 答案 开始 ， 其 中 追加 被 取代 为 使 用 一 个 参数 去 积累 找 零 钱 的 解法 。 
这 个 作为 累加 器 的 参数 通常 是 一 个 表 。 我 们 是 不 是 应 该 把 它 换 成 序列 呢 ? 


fun seqChange (coins, coinvals, 0, coinsf) 
seqChange (coins, [], amount, coinsf) 
seqChange (coins, c::coinvals, amount, coinsf} 
if amount<0 then coinsf () 
else seqgChange(c::coins, c::coinvals, amount-c, 

fn()=> seqChange (coins, coinvals, amount, coinsf)); 
> val seqChange = fn : int list * int list * int * 
> (unit -> int list seq) -> int list seq 


这 里 并 没有 直接 使 用 序列 ， 而 是 用 了 一 个 尾 函 数 coinsf， 具 有 类 型 unit 一 int list seq。 这 可 以 让 
我 们 在 第 一 行使 用 Cons， 而 不 是 急于 计算 其 参数 的 Seq.cons。 并 且 还 需要 在 内 层 递 归 中 使 用 
fn 来 将 它 延 时 。 这 类 处 理 在 Haskell 中 要 容易 些 。 

现在 我 们 来 枚 举 解 ， 每 一 个 都 可 立即 得 到 : 


Cons (coins , coinsf ) 
coinsf () 


fo ow 


seqChange((], gbcoins, 99, fn ()=> Nil); 

> Cons ([2, 2, 5, 20, 20, 50], fn) : int list seq 
Seq .tl it; 

> Cons ([1, 1, 2, 5, 20, 20, 50], fn) : int list seq 
Seq .tl it; 


> Cons ([1, 1, 1, 1, 5, 20, 20, 50], fn) : int list seq 


增加 的 开销 是 不 大 的 。 计算 所 有 的 解 需要 354 毫 种 ， 比 这 个 函数 使 用 表 的 版 本 要 慢 大 约 1/3， 
但 却 是 原来 a1Caange 的 两 倍速 度 。 


随机 数 。 在 3.18 节 ， 我 们 为 排序 的 例子 生成 了 由 10 000 个 随机 数组 成 的 表 。 然 而 ， 通 常 都 
不 能 事先 知道 需要 多 少 个 随机 数 。 一 般 来 说 ， 随 机 数 发 生 器 是 一 个 过 程 ， 它 在 局 部 变量 中 存 
储 了 一 个 随机 数 “ 种 子 ”。 在 函数 式 语 言 中 ， 可 以 定义 一 个 无 穷 的 随机 数 序列 。 这 个 做 法 隐藏 
了 实现 的 细节 ， 并 且 可 以 在 需要 时 生成 随机 数 。 


local val a = 16807.0 and m = 2147483647.0 
fun nextRand seed = 
let val t = a*seed 
in t - m * real(floor(t/m)) end 
in 
fun randseq s = Seq.map (secr op/ m) 


(Seq .iterates nextRand (real s)) 
end; 


> val randseq = fn : int -> real seq 
观察 一 下 Seq.iterates 是 怎样 生成 一 个 数 的 序列 的 ， 而 其 中 每 一 个 元 素 都 通过 Seq.map 被 除 以 m。 
最 后 的 随机 数 是 在 0 和 1 之 间 的 实数 ， 但 不 包括 0 和 1。 使 用 Seq.map 可 以 将 它们 转换 成 0 到 9 之 间 
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的 整数 : 


Seq.map (floor o secl(10.0) op* ) (randseq 1); 

> Cons (0, fn) : int seq 

Seq.take (it, 12); 

> [0, 0, 1, 7, 4, 5, 2, 0, 6, 6, 9, 3] : int list 

素数 。 素 数 的 序列 可 以 用 埃 拉 托 色 尼 得法 (Sieve of Eratosthenes) 来 计算 。 

。 从 序列 [2, 3, 4, 5, 6, … ] 开 始 。 

。 把 2 作为 素数 。 删 除 其 他 所 有 2 的 倍数 ， 因 为 它们 不 可 能 是 素数 。 这 使 得 序列 剩 下 [3, 5, 

7,9,11,...1]。 

*。 把 3 作为 素数 ， 并 删除 它 的 其 他 倍数 。 这 使 得 序列 剩 下 15.7, 11, 13, 17, Jo 

。 把 5 作为 素数 es 
在 每 一 步 中 ， 序 列 都 只 包含 那些 不 能 被 已 经 生成 的 素数 整除 的 数 。 因 此 序列 的 首 元 素 是 素数 ， 
并 且 这 一 过 程 可 以 无 限 地 进行 下 去 。 

消 数 si 删除 序列 中 的 某 个 数 的 倍数 ， 而 sieve 不 断 地 对 序列 进行 篇 选 (sift)。 

fun sift p = Seq.filter (fn n => n mod p <> 0); 

> val sift = fn : int -> int seq -> int seq 


fun sieve (Cons(p,nf)) = Cons(p, fn()=> sieve (sift p (nf()))); 
> val sieve = fn : int seg -> int seq 


素数 序列 primes 是 从 sieve [2, 3, 4, 5, … ] 得 出 的 。 在 序列 被 检查 之 前 ， 除 首 元 素 外 ， 并 不 会 生 
成 其 他 素数 。 


val primes = sieve (Seq.from 2); 

> val primes = Cons (2, fn) : int seq 

Seq.take (primes, 25); 

> [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 

> 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97] : int list 
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类 型 tr seg， 而 尾 国 数 具有 类 型 xnit~T seg。 我 们 可 以 通过 加 入 函数 调用 …0 或 函数 抽象 
fn( )=> … 来 纠正 类 型 错误 。。 


5.15 数值 计算 


序列 在 数值 分 析 中 也 有 应 用 。 初 看 上 去 这 有 点 意外 ， 不 过 ， 毕 竟 很 多 数值 方法 都 是 基于 
无 穷 数 列 的 。 为 什么 不 直接 表达 它们 呢 ? 

平方 根 是 一 个 简单 的 例子 。 回 忆 一 下 牛顿 -拉夫 森 方 法 ， 它 用 来 计算 某 个 数 a 的 平方 根 。 
从 一 个 正 数 近似 值 zx 开始 ， 通 过 下 面 的 公式 计算 下 一 个 近似 值 


Xi -(£+5,] /2 
k 


当 相 邻 的 两 个 近似 值 足够 接近 时 ， 计 算 就 可 以 停止 了 。 使 用 序列 ， 可 以 直接 进行 这 个 计算 。 


O 埃 拉 托 色 尼 乌 法 几乎 是 所 有 函数 式 语言 课本 里 面 的 例子 ， 特 别 是 采用 迟 性 求 值 的 语言 。 它 初步 展示 了 函数 
式 语言 中 无 穷 数据 结构 简洁 和 令 人 吃惊 的 表达 能 力 。 一 一 译 者 注 
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fun nextApprox a x = (a/x + x) / 2.0; 

> val nextApprox = fn : real -> real -> real 
Seq . take (Seq.iterates (nextApprox 9.0) 1.0, 7); 

> (1.0, 5.0, 3.4, 3.023529412, 3.000091554, 
> 3.000000001, 3.0] : real list 


最 简单 的 停止 测试 条 件 是 当 两 个 近似 值 差 的 绝对 值 小 于 某 个 给 定 的 允许 误差 e > 0 (PMS 
作 eps)。” 
fun within (eps:real) (Cons(x,xf)) = 
let val Consty,yf) = xf) 
in if Real.abs{x-y) < eps then y 
else within eps (Consly,yf)) 


end; 
> val within = fn : real -> real seq -> real 


让 10 作为 允许 误差 ，1 作 为 初始 近似 值 ， 则 得 到 了 一 个 平方 根 函 数 : 


fun groot a = within 1E~6 (Seq.iterates (nextApprox a) 1.0); 

> val qroot = fn : real -> real 

qroot 5.0; 

> 2.236067977 : real 

it* it; 

> 5.0 : real . 
用 Fortran 来 编写 这 个 程序 不 会 更 好 吗 ? 这 个 例子 来 自 Hughes (1989) 以 及 Halfant 和 Sussman 
(1988)， 他 们 说 明了 涉及 序列 的 那些 可 独立 互 换 的 部 分 是 怎样 组 合 到 数值 算法 中 去 的 。 每 个 
算法 都 是 为 适合 它 的 应 用 而 定制 的 。 

例如 ， 有 很 多 种 终止 测试 的 方法 可 以 选用 。 通 过 witpin 来 测试 绝对 差 (jx-y|< e) 的 办 法 
对 于 大 数 来 说 就 过 于 严格 了 。 我 们 可 以 测试 相对 差 ( |x/y~1 |< ec) 或 更 有 意思 的 : 


k- 
(ixj+|y))/2 +1 E 
有 时 甚至 应 该 更 为 谨慎 地 测试 三 个 或 更 多 的 近似 值 是 否 足 够 接近 。 
每 个 终止 测试 都 可 以 包装 成 一 个 从 序列 到 实数 的 函数 。 像 Richardson 插 补 法 这 样 的 技术 
(用 于 加 速 级 数 的 收敛 ) 可 以 包装 成 从 序列 到 序列 的 函数 。 这 些 函 数 可 以 组 合 起 来 进行 数值 微 
分 和 积分 等 计算 。 


练习 5.32 通过 生成 无 穷 和 序列 来 计算 


指数 函数 e”。 
练习 5.33 书写 一 个 ML 函数 ， 使 用 上 面 提 到 的 另外 两 种 终止 测试 来 从 序列 中 取得 一 个 值 。 利 


O ”这 里 的 递归 调用 传递 的 是 Cons(y, y， 而 不 是 调用 具有 同样 值 的 *R)， 以 避免 调用 两 次 态 )。 应 该 记得 我 们 的 
序列 不 是 真正 的 情 性 求 值 ， 只 是 使 用 了 传 名 调用 规则 。 
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用 它 声 明 平方 根 (RER) 函数 。 


5.16 交替 和 序列 的 序列 


给 定 无 穷 序列 xg 和 yq， 考虑 形成 一 个 所 有 序 偶 (x, y) 的 序列 、， 其 中 x 来 自 xg 且 y 来 自 yg。 这 
个 问题 描绘 了 无 穷 数 据 结构 计算 的 微妙 之 处 。 

就 像 在 上 面 5.10 节 所 提 到 的 ， 可 以 通过 map 使 用 柯 里 的 序 偶 函 数 Pair 来 生成 一 个 表 的 表 。 
类 似 地 也 可 以 生成 一 个 序列 的 序列 : 


. fun makeqq (xq,yq) = Seq.map (fn x=> Seq.map (pair x) yq) xq; 
> val makeqq = fn : ‘a seq * ' seq -> (‘a * ‘b) seq seq 


序列 的 序列 可 以 通过 iakeqq(xqgq, (m,n)) 来 查看 。 返 回 的 表 的 表 是 xqg 左 上 和 角 m x n 的 矩形 。 


fun takeqg (xqgq, (m,n)) = map (secr Seq.take n) (Seq.take(xqq,m)); 
> val takeqq = fn 

> : ʻa seq seq * (int * int) -> ‘a list list 

makeqq (Seq.from 30, primes); 

> Cons (Cons ((30, 2), fn), fn) : (int * int) seq seq 
takeqq (it, (3,5)); 

> [£(30, 2), (30, 3), (30, 5), (30, 7), (30, 11)], 

> [(31, 2), (31, 3), (31, 5), (31, 7), (31, 11)], 

> ((32, 2), (32, 3), (32, 5), (32, 7), (32, 11)]] 

> : (int * int) list list 


函数 List. concat 将 表 的 元 素 追 加 在 一 起 ， 形 成 一 个 表 。 让 我 们 也 声明 一 个 类 似 的 枚 举 函 数 
enumerate 来 合并 序列 的 序列 。 因 为 序列 可 能 是 无 穷 的 ， 所 以 必须 使 用 交替 函数 interleave 来 取 
代 追 加 函数 。 

下 面 是 主要 思想 。 如 果 输 入 的 序列 具有 头 xg 和 尾 x99， 那 么 就 递归 地 枚 举 xqgq 并 将 结果 和 
xq 进 行 交替 。 然 而 如 果 我 们 以 List.comncat 作 为 模型 ， 那 么 将 会 得 到 一 个 错误 的 代码 : 


fun enumerate Nil = Nil 
| enumerate (Cons(xq,xqf)) = Seq.interleave(xq, enumerate (xqf())); 
> val enumerate = fn : ‘a seq seq -> ‘a seq 


如 果 这 个 函数 的 输入 是 无 穷 的 ，ML 将 产生 一 系列 无 限 的 递归 调用 ， 而 不 会 输出 任何 结果 。 这 
个 版 本 在 惰性 求 值 的 函数 式 语言 中 也 许 是 对 的 ， 但 是 在 ML 中 当 有 输出 产生 时 ， 必 须 显 式 地 终 
止 递归 。 这 需要 更 复杂 的 情形 分 析 。 如 果 输 入 的 序列 非 空 ， 那 么 要 继续 分 析 它 的 首 元 素 序 
列 ; 如 果 仍 是 非 空 ， 那 么 里 面 就 包含 了 一 个 可 以 输出 的 元 素 。 

Nil 

enumerate (xqf()) 


fun enumerate Nil 
| enumerate (Cons(Nil, xqf)) 
| enumerate (Cons(Cons(x,xf), xqf)) 
Cons(x, fn()=> Seq.interleave (enumerate (xqf()), xf())); 
> val enumerate = fn : ‘a seq seq -> ‘a seq 


上 面 第 二 种 和 第 三 种 情形 很 像 错 误 版 本 中 对 交 赫 函数 interleave 的 使 用 ， 不 过 内 部 的 fn( )=> … 
终止 了 递归 调用 。 
下 面 是 所 有 正 整 数 序 偶 的 序列 。 


val pairgg = makeqq (Seq.from 1, Seq.from 1); 
> val pairqq = Cons (Cons ((1, 1), fn), fn) 
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> : (int * int) seq seq 

Seq .take (enumerate pairqq. 18); 

> €(1, 1), (2,1), (1, 2), (3,1), (1,3), (2, 2), (1, 4), 
> (4, 1), (1, 5), (2, 3), (1, 6), (3, 2), (1, 7), (2, 4), 
> (1, 8), (5, 1), (1, 9), (2, 5)] : (int * int) list 


[202] 我 们 可 以 更 为 精确 地 描述 枚 举 的 顺序 。 看 看 下 面 的 声明 : 
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fun powof2 n = repeat double n 1; 

> val powof2 = fn : int -> int 

fun pack(i,j) = powof2(i-1) * (2*j - 1); 

> val pack = fn : int * int -> int 
这 个 压缩 函数 ,pack(i, 办 = 2°" Qj - 0 ,建立 了 正 整数 和 正 整数 序 偶 间 一 一 对 应 的 关系 。 因 此 ， 
两 个 可 数 集 的 笛 卡 尔 乘 积 仍 是 可 数 集 。 下 面 是 这 个 函数 值 的 一 个 小 表格 : 

val ngq = Seq.map (Seq.map pack) pairqq; 

> val ngq = Cons (Cons (1, fn), fn) : int seq seq 

takeqq (ngqq, (4,6)); 

> [[1, 3, 5, 7, 9, 11), 

> [2, 6, 10, 14, 18, 22], 

> (4, 12, 20, 28, 36, 44], 

> [8, 24, 40, 56, 72, 88]] : int list list 


我 们 用 枚 举 函 数 将 压缩 函数 解码 ， 返 回 一 个 按 自然 顺序 排列 的 正 整数 序列 : 


` Seq.take (enumerate ngq, 12); 
> [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12] : int list 


不 难看 出 为 什么 是 这 样 的 。 每 次 交替 都 从 一 个 序列 中 取 一 半 元 素 ， 而 从 另 一 个 序列 中 取 另 一 
半 。 不 断交 赫 地 将 元 素 在 输出 序列 中 的 位 置 按照 二 的 竹 来 分 配 ， 就 像 在 压缩 函数 中 的 一 样 。 
练习 5.34 预测 ， 或 至 少 解释 ，ML 对 于 下 面 表达 式 的 回应 : 

enumerate (Seq.iterates I Nil); 
练习 5.35 生成 一 个 所 有 有 限 长 正 整数 表 的 序列 。( 提示 : 首先 声明 一 个 函数 来 生成 给 定 长 度 
正 整 数 表 的 序列 。) 


练习 5.36 ”证 明 对 于 所 有 正 整 数 K， 存 在 唯一 一 对 正 整 数 斌 W 使 得 E = pack(i, j) pack(i, 让 的 二 
进 制 表示 是 什么 ? 

练习 5.37 通过 改编 类 型 a seq 的 定义 来 声明 一 个 无 穷 二 又 树 类 型 。 书 写 函 数 ir， 当 应 用 到 整 
数 + 上 时 ， 构 造 一 棵 无 穷 二 又 树 ， 其 根 结 点 的 标签 是 x， 两 棵 子 树 分 别 为 itrC2n) 和 itr(2n + 1)。 
练习 5.38 ( 接 上 题 。) 书写 函数 来 构造 一 个 由 给 定 的 无 穷 二 又 树 的 所 有 标签 组 成 的 序列 。 其 
中 ， 标 签 的 枚 举 顺 序 是 什么 ”然后 书写 一 个 逆 函 数 ， 构 造 一 棵 无 穷 二 又 树 ， 其 标签 来 自 一 个 
无 穷 序 列 。 


搜索 策略 和 无 穷 表 


定理 证 明 、 计 划 制 定 以 及 其 他 人 工 智能 的 应 用 都 需要 搜索 。 有 很 多 种 搜索 策略 : 
。 深度 优先 搜索 开销 很 小 ， 不 过 它 可 能 会 走 一 条 有 死胡同， 永远 走 下 去 而 找 不 到 任何 解 。 
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广度 优先 搜索 是 完全 的 (complete)， 肯 定 可 以 找到 所 有 的 解 ， 但 是 它 需 要 大 量 的 空间 。 

“深度 优先 迭代 深化 也 是 完全 的 ， 只 需要 很 少 的 空间 ， 但 是 可 能 很 慢 。 

“ 最 佳 优先 搜索 必须 由 一 个 估计 解 距离 的 函数 来 引导 。 
通过 将 解 的 集合 表示 为 一 个 惰性 表 ， 搜 索 策略 的 选择 可 以 独立 于 对 解 的 提取 和 使 用 。 情 性 表 
扮演 了 通讯 通道 的 角色 : 生产 者 生成 它 的 元 素 ， 同时， 消费 者 将 元 素 移 走 。 由 于 表 是 惰性 的 ， 
因此 它 的 元 素 在 消费 者 需要 之 前 是 不 会 生成 的 。 

图 5-1 和 图 5-2 将 深度 优先 策略 和 广度 优先 策略 进行 了 对 比 ， 将 两 者 应 用 到 同一 棵 树 上。 图 
中 所 描绘 的 是 搜索 过 程 中 某 一 时 刻 的 树 ， 尚 未 访问 到 的 子 树 被 画 成 攀 形 。 在 本 节 中 ， 所 有 的 
树 的 分 支 数 都 是 有 限 的， 但 树 的 深度 可 能 是 无 限 的 。 





图 5-2 广度 优先 搜索 树 
在 深度 优先 搜索 (depth-first search) 中 ， 先 完全 搜索 每 棵 子 树 ， 然 后 才 轮 到 它 右边 的 兄 
弟 。 图 中 的 数字 显示 了 搜索 的 顺序 。 因 为 结 点 4 是 个 叶子 ， 所 以 才 会 轮 到 访问 结 点 5， 同 时 还 
有 四 棵 子 树 等 待 访问 。 如 果 在 结 点 5 下 面 的 子 树 是 无 穷 的 ， 那 么 就 永远 不 会 到 达 其 他 子 树 了 ; 
这 个 策略 是 不 完全 的 。 深 度 优先 搜索 通常 被 称 为 回溯 。 
广度 优先 搜索 (breadth-first search) 先 访问 当前 深度 的 所 有 结 点 ， 然 后 才 移 向 下 一 个 深 
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度 。 在 图 5-2 中 ， 它 已 经 探索 了 树 的 前 三 层 。 由 于 分 支 数 目 有 限 ， 因 此 能 够 到 达 所 有 结 点 : 这 
个 策略 是 完全 的 。 然 而 ， 除 了 一 些 很 简单 的 例子 ， 它 却 不 怎么 实用 。 因 为 要 想到 达 某 个 给 定 
的 深度 ， 它 需要 访问 指数 个 数 的 结 点 ， 并 耗费 指数 数量 的 空间 。 


5.17 用 ML 实现 的 搜索 策略 


无 穷 树 是 可 以 像 无 穷 表 那样 表示 的 ， 也 就 是 用 ML 的 数据 类 型 ， 其 中 包括 一 个 延迟 求 值 的 
函数 。 但 是 ， 对 于 本 节 中 的 搜索 树 ， 一 个 结 点 的 子 树 可 以 通过 它 的 标签 来 计算 。 类 型 r 上 的 树 
(具有 有 限 分 支 数 ) 是 由 函数 next : Tr 一 Tlist 来 表示 和 的， 其 中 next x 是 x 的 子 树 表 。 

通过 利用 堆栈 来 存储 将 要 访问 的 结 点 ， 可 以 有 效 地 实现 深度 优先 搜索 。 每 一 步 都 将 表 头 
移出 堆栈 ， 换 成 它 的 子 树 next y， 这 棵 子 树 就 会 在 堆栈 中 的 其 他 结 点 之 前 被 访问 。 结 点 是 按照 
被 访问 的 顺序 记录 在 输出 序列 中 的 。 

fun depthFirst next x = 

let fun dfs [] = Nil 
| dfs(y::ys) = Cons(y, fn()=> dfs(next y @ ys)) 
in dfs [x] end; 

> val depthFirst = fn : (’a -> ‘a list) -> ‘a -> ‘a seg 
广度 优先 搜索 将 等 待 访问 的 结 点 存放 在 队列 中 ， 而 不 是 堆栈 中 。 当 y 被 访问 以 后 ，mext y 中 的 
子 结 点 会 被 放 在 队 尾 。8 

fun breadthFirst next x = 

let fun bfs [) 
|. bfs (y: :ys) 
in bfs [x] end; 
> val breadthFirst = fn: (’a -> ‘a list) -> ‘a -> ‘a seq 
两 个 策略 都 是 简单 地 以 某 种 顺序 枚 举 所 有 的 结 点 。 解 是 通过 算 子 Seq .filter 将 某 个 适当 的 谓词 
作用 到 结 点 上 来 确定 的 。 其 他 的 搜索 策略 也 可 以 通过 修改 这 两 个 函数 来 得 到 。 


(O| 最 住 优先 搜索 (best-first search)。 人 工 智 能 中 的 搜索 经 常 使 用 启发 式 距 离 函数 ， 
这 种 函数 可 以 估计 任意 给 定 结 点 到 解 的 距离 。 这 个 估计 被 加 到 已 知 的 该 结 点 到 根 结 
点 的 距离 上 ， 由 此 估计 出 从 根 经 由 该 结 点 到 解 的 距离 。 这 些 估 计 将 一 个 顺序 强加 到 
等 待 搜索 的 结 点 上 ， 而 这 些 结 点 则 存放 在 一 个 优先 队列 中 。 具 有 最 小 估计 总 距离 的 
结 点 就 是 下 一 个 要 访问 的 。 

如 果 距 离 溃 数 相当 精确 ， 最 住 优先 搜索 会 很 快 地 收敛 到 一 个 解 上 。 如 果 这 是 一 
个 第 函数 ， 那 么 最 住 优先 搜索 就 会 退化 成 广度 优先 搜索 。 如 果 它 错误 地 估计 了 真实 
的 距离 ， 那 么 最 佳 优先 搜索 可 能 永远 也 找 不 到 任何 解 。 这 个 策略 有 很 多 种 形式 ， 其 
中 最 简单 的 是 A* 算 法 。 更 多 资料 参见 Ricn 和 Knight (1991). | 


204 练习 5.39 改写 depthFirst 和 breadthFirst， 增 加 一 个 参数 : 判断 解 的 谓词 。 这 上 比 课文 中 介绍 
206| ”的 办 法 稍微 高 效 一 些 ， 因 为 它 避 免 了 对 Seq .filter 的 调用 和 对 输出 序列 的 复制 。 


练习 5.40 ” 像 上 文 介绍 的 那样 实现 最 佳 优 先 搜索 。 你 的 函数 必须 跟踪 每 一 个 结 点 到 根 结 点 的 


Nil 
Cons(y, fn(}=> bfs(ys @ next y)) 
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队列 。 . 
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距离 ， 以 便 将 它 加 到 从 该 结 点 到 解 的 估计 距离 上 。 


5.18 生成 回 文 


让 我 们 生成 字母 集 {4A, B, C} 上 的 回 文 序列 。 搜 索 树 中 的 每 一 个 结 点 将 是 这 三 个 字母 组 成 
的 表 !， 并 有 3 个 分 支 分 别 指向 结 点 #"A"::1、#"B": :1 和 #"C"::1。 





函数 nextChar 生 成 了 这 样 一 棵 树 。 
fun nextChar l = [#"A"::1, #"Bt::1, #"C"::1]; 
> val nextChar = fn : char list -> char list list 
@ X (palindrome) 是 和 自己 的 翻转 表 相 等 的 表 。 让 我 们 声明 相应 的 谓词 : 


fun isPalin l = (l = rev l); 
> val isPalin = fn : ‘’a list -> bool 


当然 ， 有 很 多 更 高 效 的 办 法 来 生成 回 文 。 我 们 的 方法 旨 在 强调 不 同 搜索 策略 间 的 不 同 点 。 首 
先 声明 一 个 函数 来 帮助 显示 结 点 序列 (implode 将 字符 表 连 成 一 个 字符 串 ): 

fun show n csq = map implode (Seq.take(csq,n)); 

> val show = fn : int -> char list seg -> string list 
广度 优先 搜索 是 完全 的 ， 可 以 生成 所 有 的 回 文 。 让 我 们 在 过 滤 前 后 检查 一 下 这 个 序列 : 207 

show 8 (breadthFirst nextChar [1); 

> ["", "A", "B", "C", "AA", "BA", "CA", "AB"] : string list 

show 8 (Seq.filter isPalin (breadthFirst nextChar [])); 

> ["", "A", "B", "C", "AA", "BB", "CC", "AAA"] : string list 
深度 优先 搜索 则 不 能 找到 所 有 解 。 因 为 树 的 最 左 分 支 是 无 穷 的 ， 所 以 搜索 永远 也 离 不 开 这 个 
分 支 。 我 们 甚至 都 不 需要 调用 Seq filter: 

show 8 (depthFirst nextChar []) 

> ["”, "A", "AA", "ADA", "AAAA", "AAAAA", *“AAAAAA", 

> "AAAAAAA"}] : string list 
如 果 在 一 个 无 穷 分 支 上 没有 解 ， 那 么 深度 优先 搜索 根本 找 不 到 任何 东西 。 让 我 们 从 标签 8 开 始 
搜索 。 只 有 一 条 回 文具 有 形式 44.48: | 


show 5 (depthFirst nextChar {[#"B"]); 
> ["B", "AB", "AAB", "AAAB", "AAAAB"] : string list 


如 果 尝 试 在 这 个 序列 中 发 现 一 条 以 上 的 回 文 
show 2 (Seq.filter isPalin (depthFirst nextChar [#"B"])); 
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een 它 将 永远 运行 下 去 。 
另 一 方面 ， 广度 优先 搜索 探索 了 8 以 下 的 整个 子 树 。 过 滤 序 列 产 生 了 所 有 以 8 结 尾 的 回 文 : 
show 6 (breadthFirst nextChar [#"B"]); 
> ["B", "AB", "BB", "CB", "AAB", "BAB"] : string list 
show 6 (Seq.filter isPalin (breadthFirst nextChar [#"B"])); 
> ["B", "BB", "BAB", "BBB", "BCB", "BAAB"] : string list 
我 们 再 次 看 到 了 完全 搜索 策略 的 重要 性 。 
5.19 八 皇 后 问题 


有 一 个 经 典 的 问题 ， 要 求 在 一 个 国际 象棋 棋盘 上 放置 8 个 皇后 ， 使 得 任何 一 个 皇后 都 不 能 
攻击 另 一 个 。 也 就 是 说 ， 任 何 两 个 皇后 不 能 在 同一 行 ， 同 一 列 或 同一 斜 线 上 。 可 以 通过 考察 
所 有 将 皇后 逐 列 安全 放置 的 办 法 来 求解 。 搜 索 树 的 根 结 点 是 一 个 空 棋盘 。 在 第 一 列 一 共有 8 个 
位 置 可 以 放置 皇后 ， 因 此 从 根 结 点 到 有 一 个 皇后 的 棋盘 有 8 个 分 支 。 一 旦 有 一 个 皇后 被 放置 在 
第 一 列 ， 第 二 列 可 以 安全 放置 皇后 的 位 置 就 会 少 于 8 个 ; 分 支 数 目 随 着 树 的 深入 而 减少 。 含 有 
8 个 皇后 的 棋盘 必然 是 一 个 叶子 。 1 

由 于 树 是 有 限 的 ， 因 此 深度 优先 搜索 可 以 找到 所 有 的 解 。 大 多 数 发 表 了 的 解法 ， 不 论 是 
过 程式 的 还 是 函数 式 的 ， 都 是 直接 编码 深度 优先 搜索 的 。 过 程式 程序 ， 通 过 将 皇后 所 占用 的 
行 和 斜 线 存储 在 布尔 数组 里 面 ， 可 以 迅速 地 找到 所 有 解 。 这 里 ， 八 皇后 问题 只 是 作为 不 同 搜 
索 策 略 的 演示 。 

我 们 可 以 将 含有 皇后 的 棋盘 表示 为 行 号 的 表 。 表 [q1, …, g 代 表 了 这 样 一 个 棋盘 ， 其 中 皇 
后 们 在 第 i 列 的 第 q 行 ，i = 1, …,k。 函 数 safeQueen 测 试 一 个 皇后 是 否 能 安全 地 放置 在 下 一 列 
的 第 newg 行 ， 然 后 形成 新 的 棋盘 [newq, q1, …, 9d。( 之 前 的 列 只 是 被 左 移 了 一 列 。) 新 放置 的 
皇后 不 能 和 原 有 的 其 他 皇后 在 同一 行 或 同一 斜 线 上 。 注 意 |newq - 4i|= i 仅 当 newq 和 9g: 在 同一 
斜 线 上 。 

fun safeQueen oldqs newq = 

let fun nodiag (i, []) = true 
| nodiag (i, q::qs) = 


Int .abs (newq-q) <>i andalso nodiag (i+1 ,gs) 
in not (newq mem oldgs) andalso nodiag (1,oldqs) end; 


为 了 生成 搜索 树 ，、 函 数 nextQueen 以 一 个 现 有 的 棋盘 为 参数 ， 返 回 所 有 安全 加 入 了 新 皇后 
盘 列 表 。 观 察 一 下 表 算 子 的 使 用 ， 通 过 mep 应 用 了 一 个 切片 ， 并 通过 /iiter 应 用 Dp 
数 。 八 皇后 问题 也 推广 到 了 "和 皇后， 也 就 是 将 "个 皇后 安全 地 放置 在 ” x n 的 棋盘 上 。 道 过 调用 
upto (在 3.1 节 声明 ) 可 以 生成 [1, …, n] 的 候选 皇后 表 。 

fun nextQueen n qs = 

map (secr op:: qs) (List. filter (safeQueen qs) (upto(1,n))); 

> val nextQueen = fn : int -> int list -> int list list 
现在 定义 一 个 谓词 来 判断 解 。 由 于 只 会 考虑 安全 位 置 ， 解 就 是 任何 一 个 包含 了 "个 皇后 的 
棋盘 。 


fun isFull n qs = (length qs=n) ; 
> val isFull = fn : int -> ‘a list -> bool 
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图 数 depthFirst 可 以 找到 八 皇后 全 部 的 92 个 解 。 这 需要 130 毫 秒 : 


fun depthQueen n = Seq.filter (isFull n) (depthFirst (nextQueenn) [1]); 

> val depthQueen = fn : int -> int list seq 

Seq .toList (depthQueen 8); 

> [[4d, 2, 7, 3, 6, 8, 5, 1], [5, 2, 4, 7, 3, 8, 6, 1], 

> [3, 5, 2, 8, 6, 4, 7, 1], [3, 6, 4, 2, 8, 5, 7, 1], 

> f5, 7, 1, 3, 8, 6, 4, 2], [4, 6, 8, 3, 1, 7, 5, 2] 

> ...jJ : int list list 
由 于 序列 是 惰性 的 ， 因 此 可 以 逐个 地 求 出 所 需 的 解 。 深 度 优先 搜索 很 快 就 找到 了 第 一 个 解 
(6.6 毫 秒 )。 虽 然 对 于 八 皇 后 问题 来 说 这 样 做 的 意义 不 大 ,但 是 十 五 皇后 问题 的 解 超过 两 百 万 
个 。 我 们 可 以 在 一 秒 钟 之 内 计算 出 其 中 的 几 个 : 

Seq .take (depthQueen 15, 3); 

> [[8, 11, 7, 15, 6, 9, 13, 4, 14, 12, 10, 2, 5, 3 

> [11, 13, 10, 4, 6, 8, 15, 2, 12, 14, 9, 7, 5, 3, 1], 

> [13, 11, 8, 6, 2, 9, 14, 4, 15, 10, 12, 7, 5, 3 

> : int list list 


想像 一 下 可 以 按照 需要 生成 解 的 过 程式 程序 该 怎样 设计 。 这 很 可 能 涉及 到 协同 例 程 
(coroutines) 或 通信 进程 (communicating processes ) 。 


函数 preadihFirst 要 慢 些 才能 找到 解 。。 而 且 找到 一 个 解 所 花 的 时 间 和 找到 所 有 解 差 不 
多 ! 因为 解 都 出 现在 搜索 树 的 同一 深度 ; 找到 第 一 个 解 基本 上 需要 遍历 整 棵 树 。 


5.20 RRE 


深度 优先 近代 深化 (depth-first iterative deepening) 结合 了 其 他 搜索 过 程 的 优点 。 像 深度 
优先 搜索 那样 只 需要 很 少 的 空间 ; 同时 又 像 广度 优先 那样 是 完全 的 。 这 个 策略 反复 地 搜索 一 
棵 树 ， 直 到 某 一 有 限 但 又 不 断 增 长 的 深度 。 首 先 这 个 策略 进行 深度 优先 搜索 到 某 个 深度 4， 返 
回 所 有 找到 的 解 。 然 后 再 进行 搜索 到 深度 24， 返 回 所 有 在 深度 4 和 2d 之 间 找 到 的 解 。 然 后 再 搜 
索 到 深度 3d， 等 等 。 由 于 每 次 搜索 都 是 有 限 的 ， 这 个 策略 最 终 会 到 达 任何 深度 。 < 

重复 地 搜索 并 不 像 初 看 上 去 那样 浪费 。 和 迭代 深化 所 增加 的 到 达 某 一 深度 所 用 的 时 间 不 会 
超过 某 一 个 常数 因子 ， 除 非 搜索 树 分 支 非常 少 。 深 度 kd 和 (k + 1)d 之 间 的 结 点 要 比 kd 之 上 的 结 
点 多 (Korf, 1985). 

为 了 简单 起 见 ， 让 我 们 实现 4 = 1 的 达 代 深化 。 它 将 产生 和 广度 优先 搜索 一 样 的 结果 ， 不 
同 的 是 它 需要 的 时 间 较 长 ， 但 节省 很 多 空间 。 

函数 depthFirst 不 太 容易 通过 修改 来 实现 迭代 深化 ,因为 它 的 堆栈 包括 了 来 自 树 的 不 同 深 
度 的 结 点 。 下 面 的 搜索 函数 不 使 用 堆栈 ; 它 使 用 单独 的 递归 调用 来 访问 每 一 棵 子 树 。dfs 的 参 
数 sf 积 累 了 (可 能 是 无 穷 的 ) 解 的 序列 。 

fun depthlter next x = 

let fun dfs k (y, sf) = 
if k=0 then fn()=> Cons(y, sf) 
else foldr (dfs (k-1)) sf (next y) 
fun deepen k = dfs k (x, fn()=> deepen (k+1)) () 
in deepen 0 end; 
> val depthIter = fn : (’a -> ʻa list) -> ‘a -> ’a seq 


O 它 需 要 310 毫 秒 ， 使 用 高 效 队列 的 版 本 需要 160 毫 秒 。 
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让 我 们 详细 地 考察 一 下 这 个 声明 。 必 须 使 用 尾 函 数 (具有 类 型 unit 一 a seq)， 而 不 能 使 用 序列 ， 
主要 是 为 了 延 时 求 值 。 函 数 调 用 dfs k O, sf ) 构 造 了 一 个 序列 ， 里 面包 含 了 在 结 点 y 之 下 深度 上 
处 找到 的 所 有 解 ， 这 个 序列 后 面 还 跟随 了 序列 sfO。 这 里 有 两 种 情形 需要 考虑 。 

1. 如 果 k = 0， Meter 

2. 如 果 k > 0， 那 么 设 next y = [yis …, yn]。 这 些 结 点 ， 也 就 是 y 的 子 树 ， 通 过 foldr 来 递归 处 
理 。 扩 果 序列 包 迫 了 所 有 在 yi Ek 处 的 人 

dfs (k — 1) (yı, ... dfs (kK — D On Sf)... O 

调用 deepen X 建 立 一 个 尾 国 数 来 计算 deepen (k + 1)， 并 将 其 传 给 dfs ，djs 将 在 之 前 插入 所 有 在 
深度 k 处 找到 的 解 。 

让 我 们 在 前 面 的 例子 上 试验 一 下 这 个 策略 。 迭 代 深 化 生成 了 和 广度 优先 搜索 同样 的 回 文 
序列 : 

show 8 | (Sea .filter isPalin (depthIter nextChar [])); 

> ["", "A", "B", "C", "AA", "BB", "CC", "“AAA"] : string list 
它 也 可 以 用 来 解决 八 皇后 问题 ， 但 相当 慢 (340 毫 秒 )。 使 用 较 大 的 深度 间隔 4， 和 迭代 深化 可 以 
恢复 一 些 深度 优先 搜索 的 效率 ， 同 时 保持 搜索 的 完全 性 。 


练习 5.41 depthlter 中 的 一 个 错误 是 ， 在 搜索 空间 有 穷 的 情况 下 ， 它 的 探索 会 超过 树 的 深度 。 
在 试图 寻找 八 皇 后 问题 的 第 93 个 解 时 ， 它 会 永远 运行 下 去 。 试 着 改正 这 个 错误 ， 看 看 你 的 版 
本 和 depthlter 一 样 快 吗 ? 

练习 5.42 推广 函数 depthlter， 把 深度 间隔 d 作 为 它 的 参数 。 使 用 d = 5 来 生成 回 文 。 和 其 他 策 
赂 得 到 的 结果 有 什么 不 同 吗 ? 

练习 5.43 ”声明 一 个 有 穷 分 支 但 可 能 是 无 穷 深 度 的 搜索 树 的 数据 类 型 ， 使 用 类 似 序列 的 表示 


方法 。 书 写 一 个 函数 来 构造 根据 参数 next : a 一 a list 所 生成 的 树 。 给 出 一 个 不 能 用 这 种 方法 生 
成 的 树 的 例子 。 


要 点 小 结 


。MLIL 表 达 式 的 计算 结果 可 以 是 一 个 函数 。 

。 柯 里 函数 就 像 一 个 具有 多 个 参数 的 函数 。 

。 高 阶 函 数 封装 了 首 用 的 计算 形式 ,减少 了 单独 的 函数 声明 。 

。 情 性 表 可 以 包含 无 穷 多 个 元 素 , 但 只 有 有 穷 数 目的 元 素 可 以 被 计算 出 来 。 
* 无 穷 表 可 以 连接 消费 者 和 生产 者 ， 使 得 项 目 仅 在 被 消费 时 才 产 生 。 





第 6 章 ”函数 式 程序 的 论证 


大 多 数 程序 员 都 知道 让 一 个 程序 工作 是 多 么 地 困难 。 在 20 世 纪 70 年 代 ， 软 件 项 目的 复杂 
性 增长 到 从 未 有 过 的 程度 ， 程 序 员 们 已 经 明显 地 应 付 不 了 了 。 很 多 系统 被 推迟 和 取消 ; 开发 
成 本 逐步 升 高 。 为 了 应 对 那 时 的 软件 危机 ， 出 现 了 几 种 新 的 方法 论 ， 每 一 种 都 以 掌控 大 型 系 
统 的 复杂 性 为 出 发 点 。 

结构 化 程序 设计 探索 如 何 将 程序 组 织 成 具有 简单 接口 的 简单 部 分 。 抽 条 数据 类 型 则 使 程 
序 员 可 以 将 数据 结构 及 其 操作 看 成 是 一 个 数学 对 象 。 下 一 章 是 关于 模块 的 ， 那 里 会 对 这 个 主 
题 进行 更 多 的 论述 。 

函数 式 程序 设计 和 逻辑 程序 设计 的 目标 是 将 计算 直接 用 数学 的 方式 表达 。 复 杂 的 机 器 状 
态 是 不 可 见 的 ; 程序 员 一 次 只 需要 理解 一 个 表达 式 。 
、 本 章 将 介绍 程序 正确 性 证 明 。 像 其 他 应 对 软件 危机 的 方法 一 样 ， 形 式 方法 的 目的 也 在 于 

增强 我 们 的 理解 能 力 。 首 先 要 知道 的 就 是 ， 只 有 当 这 个 程序 的 描述 是 正确 的 时 候 ， 它 才 会 
“工作 ”。 我 们 的 思维 并 不 能 分 析 数 以 亿 万 计 的 运行 步骤 ， 然 而 ， 如 果 程 序 是 以 数学 方式 表达 
的 ， 那 么 每 一 阶段 的 计算 就 都 可 以 用 一 个 公式 来 描述 。 程 序 可 以 被 验证 一 一 证 明 是 正确 
的 一 一 或 者 从 它 的 描述 中 时 出 。 大 多 数 的 早期 程序 验证 工作 都 集中 在 Pascal 和 类 似 的 语言 上 ， 
而 函数 式 语言 则 更 为 容易 论证 ， 因 为 它们 不 涉及 机 器 状态 。 


本 章 提要 


这 一 章 讲 述 了 函数 式 程序 的 证 明 ， 特 别 着 重 于 归纳 法 。 证 明 的 方法 是 严格 的 ， 但 不 是 正 
式 的 。 证 明 的 目的 在 于 增加 我 们 对 程序 的 理解 。 

本 章 包 括 以 下 几 节 : 

* 一 些 数学 证 明 的 原理 。 有 一 类 MEL 程 序 可 以 在 初等 数学 范围 内 进行 处 理 。 有 些 整 数 函 数 

可 以 用 数学 归纳 法 来 验证 。 

* 结构 归纳 法 。 这 个 原则 把 数学 归纳 法 推广 到 了 有 限 的 表 和 树 。 这 部 分 还 展示 了 高 阶 函 数 

的 证 明 。 

"一 般 性 归纳 原理 。 这 部 分 讨论 了 一 些 不 寻常 的 归纳 证 明 。 良 基 归 纳 为 此 类 证 明 提供 了 统 

一 的 框架 。 

"描述 和 验证 。 本 章 所 介绍 的 方法 将 应 用 到 一 个 大 的 例子 上 : 某 合 并 排序 函数 的 验证 。 这 

部 分 也 讨论 了 一 些 程序 验证 的 局 限 性 。 


一 些 数学 证 明 的 原理 


本 章 的 证 明 是 以 典型 的 离散 数学 方式 引出 的 。 大 多 数 证 明 都 是 通过 归纳 法 进行 的 。 很 多 
论证 都 涉及 方程 式 ， 将 -- 项 替换 成 相等 的 另 一 项 ， 当 然 ， 逻 辑 连 接 词 和 量词 也 是 必 不 可 少 的 。 
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6.1 ML 程序 和 数学 


在 证 明 中 ， 将 ML 程序 看 成 是 数学 对 象 ， 并 遵守 数学 定律 。 完 整 的 语言 理论 可 能 过 于 复杂 
了 ， 因 此 程序 的 形式 需要 限制 一 下 ， 这 里 只 允许 使 用 函数 式 的 程序 ， 而 不 允许 使 用 ML 的 命令 
式 功 能 。 类 型 被 解释 为 集合 ， 这 将 限制 数据 类 型 声明 的 形式 。 异 常 也 是 不 允许 的 ， 虽 然 把 它 
放 进 我 们 的 框架 中 并 不 是 很 困难 。 表 达 式 要 求 是 明确 定义 的 ， 必 须 具 有 合法 的 类 型 ， 并 且 代 
表 可 以 终止 的 计算 。 
如 果 所 有 计算 都 必须 终止 ， 那么 一 定 要 限制 递归 函数 的 定义 。 回 想 一 下 函数 Jacti， 它 是 
如 下 定义 的 : 
fun facti (n,p) = 
if n=0 then p else facti(n-1, n*p); 
2.11 节 中 说 过 这 个 函数 式 程序 是 通过 简化 来 求 值 的 : 
facti(4, 1) > facti(4 — 1,4 x 1) => facti3, 4) > --- => 24 
对 于 所 有 的 n> 0, Mfacti(n, pP RERA EMER, Athfacihike REARS BR: 
facti(O, p) = p 
facti(n, p) = facti(n — 1,n x p) 当 n>0 时 


如 果 < 0， 那 么 facti(n, p) 将 永远 计算 下 去 ， 也 就 是 无 定义 的 。 可 以 认为 factiln, p) 仅 当 n> 0 时 
才 是 有 意义 的 ， 后 者 是 函数 的 前 提 条 件 〈Precondition ) 。 

再 举 一 例 ， 考 虑 下 面 的 声明 : 

fun undef (x) = undef (x) -1; 


由 于 对 于 任何 x 来 说 ，undef (x) 都 是 不 能 终止 的 ， 应 该 认为 它 是 没有 意义 的 。 同 样 ， 也 不 能 将 
undef (x) = undef (x) - 1 作为 一 条 关于 数 的 定律 ， 因 为 它 显然 是 错 的 。 

我 们 可 以 引入 值 上 L ( 称 为 “ 底 ” bottom) 来 表示 不 能 终止 的 计算 的 结果 ， 并 开发 一 种 论 
域 理 论 (domain theory) 来 论证 任意 的 递归 函数 定义 。 域 论 将 undef 解 释 成 为 一 个 对 所 有 x 都 满 
Eundef (x) = 1 的 函数 。 论 域 理论 规定 了 1 - 1 = 上 ， 所 以 undef (x) = undef (x) - 1 的 意思 只 是 
41=1， 这 是 有 效 的 。 不 过 ， 论 域 理论 是 复杂 是 难 懂 和 的。 值 1 引 入 了 对 于 所 有 类 型 的 偏 序 ， 理 论 
中 的 所 有 函数 在 这 个 偏 序 上 都 必须 是 单调 和 连续 的 ， 递 归 函 数 则 表示 了 最 小 不 动 点 。 通 过 强 
制 函数 必须 是 可 终止 的 ， 我 们 可 以 将 讨论 限制 在 初等 集合 论 的 范围 内 。 

将 我 们 限制 在 可 终止 计算 上 必须 承受 一 些 牺牲 ， 想 要 论证 不 总 是 终止 的 程序 就 更 难 了， 
比如 像 解释 器 这 种 程序 。 遗 憾 的 是 我 们 也 无 法 论证 情 性 求 值 ， 因 为 使 用 这 种 复杂 的 函数 式 程 
序 设计 形式 需要 数学 上 的 洞察 力 。 大 多 数 函 数 式 程序 员 最 终 都 会 学 习 一 些 论 域 理 论 ， 因 为 设 
有 其 他 办 法 去 理解 无 穷 表 上 的 计算 到 底 意 味 着 什么 。 

逻辑 符号 。 本 章 假设 你 对 形式 证 明 有 一 定 的 了 解 。 我 们 将 采用 下 面 的 符号 来 表达 人 逻辑 公式 : 

下 9 的 否定 
PAV Hy 
oyy omy 
一 六 yg 蕴涵 
$$ 当 且 仅 当 y 
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Yx.b(x) 对 于 任意 x 有 (xX) 

Ax. G(x) 存在 :有 $x) 
从 最 高 优先 级 到 最 低 优先 级 的 连接 词 排列 是 -、^、v 、 一 、 <> 。 下 面 是 公式 里 面 优先 级 
的 例子 : 

PAQ 一 Pv -RE (PrO) > (Pv (R) OBS 
量词 的 作用 域 是 尽量 向 右 扩展 的 : 
Vx.PA3y.Q —> RẸ Vx(PA(3y.(Q 一 ROV OS 
很 多 逻辑 学 家 喜欢 另 一 种 稍 有 不 同 的 省 略 点 号 的 量词 记 法 。 那 样 的 话 就 变 成 VP a Iy — R 
是 ((YxP)^(3yeo)) 一 人 的 简写 。 我 们 的 这 种 非 传统 写法 也 很 适合 用 在 证 明 里 ， 因 为 典型 公式 的 
量词 都 是 出 现在 前 面 的 。 
连接 词 和 量词 是 用 来 构造 公式 的 ， 它 们 并 不 能 取代 汉语 。 我 们 也 可 以 写 “ 对 于 所 有 x， 公 

A Vye, y) 为 真 ”。 


基础 阅读 。 很 多 离散 数学 课本 部 讲 到 了 谓词 到 辑 和 归纳 法 。Mattson (1993) 中 
对 这 两 个 主题 都 有 广泛 的 论述 。Reeves 和 Clarke (1990) 则 很 少 提 及 归纳 法 ， 但 详细 
讲述 了 过 辑 ， 还 包括 一 章 是 关于 自然 演绎 法 的 。Winskel (1993) 中 包含 了 关于 基本 
遥 辑 ， 归 纳 法 和 论 域 理论 的 一 些 章 节 。Gunter (1992) 讲述 了 论 域 理 论 以 及 其 他 关 
于 情 性 求 值 、ML 和 多 态 性 的 深入 课题 。 


6.2 数学 归纳 法 和 完全 归纳 法 


让 我 们 从 复习 数学 归纳 法 开始 。 假 设 p(n) 是 我 们 想 要 证 明 的 对 所 有 自然 数 x* (这 里 指 非 负 
整数 ) 都 成 立 的 性 质 。 要 想 利 用 归纳 法 证 明 它 ， 只 要 证 明 两 件 事 : 基本 情形 (base case), th 
就 是 WwW0)， 以 及 归纳 步骤 (induction step )， 也 就 是 对 于 所 有 k， 都 有 KA) 蕴涵 K+ 1)。 

这 个 规则 可 以 写成 下 面 这 种 形式 : 

[¢(k)] 

$0) pK+l) 

pln) 

在 这 种 记 法 中 ， 前 提 写 在 线 的 上 方 ， 结 论 写 在 下 方 。 前 提包 括 基本 情形 和 归纳 步骤 。 在 方 括 

号 中 的 公式 A) 则 做 归纳 假设 (induction hypothesis), WEHA + 1) 时 可 以 假设 它 成 立 。 限 

制 条 件 的 意思 是 k 必 须 是 一 个 新 的 变量 ， 没 有 在 其 他 的 归纳 假设 (或 其 他 条 件 ) 中 出 现 过 ， 这 

确保 k 可 以 代表 任意 的 值 。 这 个 规则 的 记 法 来 自 自 然 演绎 法 (natural deduction)， 是 一 种 关于 
证 明 的 形式 理论 。 

在 归纳 步 又 中 ， 我 们 在 假设 办 如 成 立 的 条 件 下 证 明了 wk+i)。 所 假设 的 正好 是 要 证 明 的 
性 质 ， 不 过 只 是 关于 Kk 的 。 这 可 能 看 上 去 像 是 在 循环 论证 ， 特 别 是 因为 和 k 通 常 是 同一 个 变 
量 (以 避免 一 定 要 显 式 地 写 出 归纳 假设 ) 。 那 为 什么 归纳 法 是 合理 的 呢 ? 如 果 基 本 情形 和 归 
纳 步 又 都 成 立 ， 那 么 根据 基本 情形 就 有 (0)， 并 且 通 过 不 断 使 用 归纳 步 又， 相继 得 出 8(1)、 
82)、…。 因 此 qn) 对 于 所 有 nn 都 成 立 。 

作为 一 个 简单 的 例子 ， 我 们 来 证 明 下 面 的 定理 。 


限制 条 件 : x 不 能 出 现在 Wk + 1) 的 其 他 假设 中 。 
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定理 1 每 个 自然 数 要 么 是 偶数 ， 要 么 是 奇数 。 
证 明 要 归纳 的 性 质 是 
"是 偶数 或 "是 奇数 
我 们 通过 对 mn 进 行 归纳 来 证 明 。 
基本 情形 ，0 是 偶数 或 0 是 奇数 ， 这 很 显然 : 0 是 偶数 。 
在 归纳 步骤 里 ， 我 们 作 归 纳 假设 


k 是 偶数 或 k 是 奇数 
然后 证 明 
k+ 1 是 偶数 或 k + 1 是 奇数 
根据 归纳 假设 ， 存 在 两 种 情形 : 如 果 k 是 偶数 ， 那 么 k + 1 是 奇数 ; 如 果 k 是 奇数 ， 那 么 k + 1 是 
偶数 。 由 于 两 种 情形 下 结论 都 成 立 ， 因 此 证 明 结束 。 口 


注意 ， 方 块 符号 标志 了 证 明 的 结尾 。 . 

这 个 证 明 不 仅仅 是 告诉 我 们 每 个 自然 数 不 是 偶数 就 是 奇数 ， 另 外 还 包含 了 一 个 测试 奇偶 
数 的 方法 。 这 个 测试 方法 可 以 在 ML 中 和 写成 一 个 递归 函数 : 

datatype evenodd = Even | Odd; 


fun test 0 = Even 
| test n = (case test (n-1) of 
Even => Odd 
| Odd => Even); 


在 有 些 构造 性 数学 的 理论 中 ， 从 每 个 归纳 的 证 明 中 都 可 以 自动 提取 出 一 个 递归 函数 。 我 
们 不 准备 在 这 里 研究 这 种 理论 ， 不 过 将 试 着 从 证 明 中 尽 可 能 多 地 学 些 东 西 。 如 果 每 个 证 明 除 
了 给 我 们 一 个 公式 以 外 没有 别 的 东西 ， 那 么 数学 确实 是 非常 乏味 的 。 通 过 细 化 定理 里 面 的 语 
句 ， 可 以 从 证 明 中 得 到 更 多 的 信息 。 


定理 2 任何 自然 数 都 可 以 写成 2m 或 2m + 1 的 形式 ， 其 中 m 为 某 个 自然 数 。 
证 明 由 于 这 个 性 质 有 点 复杂 ， 我 们 用 逮 辑 符号 来 表达 它 : 
dImn=2mvn=2m+1 
我 们 通过 对 "进行 归纳 来 证 明 。 
基本 情形 是 
Jm0=2mv0=2m+1 


在 m = 0 时 这 个 情形 成 立 ， 因 为 0= 2 x0. 
对 于 归纳 步骤 来 说 ， 先 假定 归纳 假设 


mk=2mvk=2m+l 
然后 说 明 (将 m 改 名 为 m' 以 避免 混淆 ) 
am) k+1=2m'vk+1=2m'+1 
根据 归纳 假设 ， 存 在 某 个 m 使 得 k = 2m 或 者 上 = 2m+1。 对 于 这 两 种 情况 ， 我 们 都 可 以 举 出 某 个 
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m' 使 得 K+ 1 = 2m' 或 者 K+ 1 =2m'4+ 1. 

。 如 果 k = 2m， 那 么 Kk+ 1 = 2m+1， 所 以 m'=m。 

。 如 果 k = 2m + 1， 那么 K+1=2m+2=2(m+1), 所 以 m'=m+1。 
这 就 完成 了 证 明 。 口 

包含 在 这 个 更 为 详细 的 证 明 中 的 函数 ， 就 不 仅仅 是 测试 数 的 奇偶 性 了 ， 它 同时 产生 了 除 
以 二 所 得 的 商 。 这 提供 了 足够 的 信息 来 重组 原 数 ， 我 们 可 以 就 此 来 检验 函数 结果 。 

fun half 0 = (Even, 0) 

| half n = (case half (n-1) of 
(Even, m) => (Odd, m) 
| (Odd, m) => (Even, m+1)); 

完全 归纳 法 。 当 k > 0 时 ， 数 学 归纳 法 将 问题 oD 简化 成 子 问 题 ok - 1)。 完 全 归纳 法 则 将 
AR) 简 化 为 个 子 问题 0), OC), … Hk 一 1)。 它 包括 了 数学 归纳 法 这 个 特殊 情形 。 

要 对 于 所 有 n> 0 的 整数 证 明 q(m) 成 立 ， 则 证 明 下 面 的 归纳 步骤 就 够 了 : 

假设 Vi <ko HARE FA OK 

PAS RAE TAERE FA: 


#0) 

{BU OO) AIA HEP A O(1) 

假设 0) 入 D 的 条 件 下 有 2) 
(GO). PLA G2) HIRE FAH) 





很 清楚 ， 对 于 所 有 nn， 它 都 蕴涵 了 9(n)， 完 全 归纳 法 因此 是 合理 的 。 这 个 规则 可 以 写成 如 下 的 
形式 : 


[Vi < koi) 
一 一 限制 条 件 : 不 能 出 现在 前 提 条 件 的 其 他 假设 中 。 


下 面 看 一 个 简单 的 证 明 。 
定理 3 所 有 m>2 的 自然 数 都 可 以 写成 素数 的 乘积 ， 站 = pP 
证 明 对 ”进行 完全 归纳 。 这 里 有 两 种 情形 。 
如 果 n 是 素数 ， 那 么 结果 是 显然 的 ， 并且 k= 1。 
如 果 n 不 是 素数 , 那么 它 可 以 被 某 个 满足 1 < m < n 的 自然 数 m 整 除 。 由 于 m < n 并 且 n/m <n, 
我 们 可 以 使 用 两 次 完全 归纳 法 的 归纳 假设 ， 把 这 两 个 数 写成 素数 的 乘积 
m= py pi nim = qq 
现在 = m x (n/m) = pi*…pk qi'*…qi。 口 
这 就 是 算术 基本 定理 的 简单 部 分 。 较 难 的 部 分 是 证 明 质 因数 分 解 的 唯一 性 ， 与 证 明 中 以 


的 选择 无 关 (Davenport，1952)。 如 证 明 所 示 ， 它 提供 了 一 个 不 确定 的 算法 来 将 数 分 解 为 质 
因数 。 
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Ol 将 证 明 作为 程序 。 在 构造 性 证 明和 函数 式 程序 之 间 存 在 着 精确 的 对 应 关系 。 如 
果 我 们 可 以 从 证 明 中 提取 程序 ， 那 么 通过 证 明定 理 就 可 以 得 到 验证 好 了 的 程序 。 当 
然 ， 并 不 是 每 个 证 明 都 是 筷 合 的 。 证 明 不 仅 必须 是 构造 性 的 〔 至 少 关键 部 分 是 ) ， 而 
且 一 定 能 描述 有 效率 的 构造 。 通 常 ， 自 然 数 概念 对 应 于 一 元 记 法 〈 后 继 )， 这 将 导致 
不 可 救 药 的 低 效 程序 。 另 外 ， 被 提取 出 的 程序 还 包含 了 还 辑 论述 的 计算 ， 虽 然 这 些 
计算 不 影响 结果 ， 但 是 应 该 将 它们 去 掉 。 很 多 人 正在 研究 这 种 类 型 的 问题 。 
Thompson (1991) 和 Turner (1991) 介绍 了 这 个 研究 领域 。 


练习 6.1 通过 归纳 法 证 明基 本 的 整数 除法 定理 : 如 果 "” 和 d 是 自然 数 且 4*0， 那 么 存在 自然 
数 4 和 r 使 得 an = dq + r 且 0 <r < 4。 用 ML 表达 对 应 的 除法 函数 。 它 的 效率 怎样 ? 

练习 6.2 ”说 明 如 果 央 站 可 以 通过 对 nm 进行 归纳 来 用 数学 归纳 法 证 明 ， 那 么 它 也 可 以 用 完全 妇 
纳 法 证 明 。 

练习 6.3 ”说 明 如 果 凡 四 可 以 通过 对 "进行 归纳 来 用 完全 归纳 法 证 明 ， 那 么 它 也 可 以 用 数学 归 
纳 法 证 明 。( 提示: 使 用 另 一 个 归纳 公式 。) 


6.3 程序 验证 的 简单 例子 


描述 (specification) 是 对 于 程序 执行 所 需要 具有 的 性 质 的 精确 叙述 。 它 指定 了 计算 的 结 
果 ， 而 不 是 方法 。 排 序 的 描述 规定 了 输出 必须 包含 和 输入 相同 的 元 素 ， 并 按照 升序 排列 。 任 
何 的 排序 算法 都 满足 这 个 描述 。 描 述 (至 少 对 于 目前 的 用 途 来 说 ) 并 没有 提 到 性 能 。 

程序 验证 (program verification) 的 意思 是 证 明 程序 满足 它 的 描述 。 现 实 中 的 描述 是 很 复 
杂 的 ，、 这 使 得 验证 变 得 十 分 困难 。 下 面 要 验证 的 每 一 个 程序 ， 其 描述 都 十 分 简单 :程序 的 结 
果 只 是 关于 输入 的 简单 函数 。 我 们 将 验证 计算 阶乘 、 斐 波 那 契 数 和 寡 的 ML 函数 。 

这 些 证 明 的 关键 是 为 函数 设计 一 个 合适 的 归纳 。 要 想 有 效 的 话 ， 归 纳 假设 必须 可 以 应 用 
到 函数 的 某 个 递归 调用 上 。 我 们 通过 函数 定义 、 其 他 数学 定律 和 归纳 假设 来 简化 基本 情形 和 
归纳 步骤 。 幸 运 地 话 ， 简 化 后 的 公式 将 显然 成 立 ， 即 使 不 然 ， 它 也 至 少 要 提出 一 个 引 理 ， 以 
便 我 们 来 事先 证 明 。 

阶 来 。 迭 代 函 数 facti 是 想 要 计算 阶乘 。 让 我 们 来 证 明 对 于 所 有 的 n>0, factiln, 1) =n!. 
回忆 一 下 阶乘 的 定义 : 0! = 1， 并 且 当 n > OF, nl = (n - 1)! xn。 在 6.1 节 里 重复 了 facti 的 
定义 。 

对 facti(n, 1) = n! 进 行 归 纳 的 想法 是 行 不 通 的 ， 因 为 它 没有 提 到 facti 的 参数 p。 这 样 的 归纳 
假设 没什么 用 处 。 我 们 必须 找到 把 facti(n, p) 和 n! 都 包括 进去 的 一 个 关系 ， 并 且 这 个 关系 要 蕴 
涵 facti(n, 1) = n!， 以 及 可 以 被 归纳 证 明 。facti(n, p) = n! x p 是 个 很 好 的 尝试 ， 不 过 还 不 够 ， 这 
里 指 的 是 某 个 特定 的 n 和 p， 但 是 p 随 递归 调用 的 进行 而 变化 着 。 正 确 的 公式 设计 包含 有 一 个 全 
称 量词 : 

Vp.facti(n, p)=n!xp 
这 个 公式 作为 关于 某 个 固定 m 的 归纳 假设 ， 对 于 所 有 的 p 断 言 了 上 面 的 等 式 成 立 。 
定理 4 对 于 每 个 自然 数 m， 都 有 jacti(n, 1) =n!. 
证 明 命题 将 通过 在 下 面 的 公式 中 令 p = 1 直接 导出 ， 而 公式 
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Vp.facti(n, p)=n'xp 
则 通过 对 ”进行 归纳 来 证 明 。 我 们 直接 使 用 "取代 上 ， 将 公式 本 身 作为 归纳 假设 。 
对 于 基本 情形 ， 必 须 证 明 
Vp.facti(0, p)=0!xp 
这 是 成 立 的 ， 因 为 facti(0,p)=p=1xp=0!xp。 
对 于 归纳 步骤 ， 由 于 归纳 假设 已 经 在 上 面 声 明 ， 接 下 来 必须 证 明 
Vp.facti(n+1, p)=(n+1)!xp 


让 我 们 思 掉 全 称 量词 并 证 明 等 号 对 于 任意 的 p 都 成 立 。 这 里 ， 通 过 将 左边 还 原 到 右边 来 简化 
等 式 : 


facti(n + 1, p) = facti(n, (n + 1) x p) [facti] 
=n! x ((n+ 1) xp) [归纳 假设 ] 
= (n! x (n+1)) xp [结合 律 ] 
=(n+1)!xp [阶乘 ] 
方 括号 中 的 注释 应 该 如 下 理解 : 


[acti] BBR “根据 facti 的 定义 ” 
[归纳 假设 ] ”意思 是 “根据 归纳 假设 
[结合 律 ] ”意思 是 ” “根据 乘法 的 结合 律 ” 
[阶乘 ] ”意思 是 ” “根据 阶乘 的 定义 ” 
在 归纳 步 又 中 ， 等 式 两 边 被 证 明 是 相等 的 。 注 意 观 察 归 纳 假设 中 被 量词 约束 的 变量 p 被 替换 成 
T(n+1)xp. 口 
形式 证 明 能 帮助 我 们 理解 程序 。 这 个 证 明 解 释 了 facti(n, p) 中 p 的 角色 。 要 归纳 的 公式 可 以 
类 比 于 过 程式 程序 验证 中 的 篇 环 不 变 式 (loop invariant)。 由 于 证 明 使 用 了 乘法 的 结合 律 ， 这 
提示 我 们 facti(n, 了) 通过 将 同样 一 套数 以 不 同 的 顺序 相 乘 而 计算 出 n!。 稍 后 ， 我 们 会 将 这 一 办 
法 推广 到 一 个 将 递归 函数 转换 成 迭代 函数 的 定理 (6.9 节 )。 这 里 ,很 多 定理 都 是 关于 如 何 有 
效率 地 实现 某 些 函数 的 。 
旨 波 那 契 数 。 还 记得 斐 波 那 契 序列 吗 ? 它 是 这 样 定义 的 : Fo=0, Fi = 1 以 及 对 于 n> 2， 
F,=Fr2+ F,-1。 我 们 将 要 证 明 它 们 可 以 通过 函数 ifibp (2.15 节 ) 计算 出 来 : 
fun itfib (n, prev, curr) : int = 


if n=1 then curr 
else itfib (n-1, curr, prevtcurr); 


可 以 看 到 ，itfib(n, prev, curn) 是 对 所 有 n> 1 定义 的 ， 我 们 要 证 明 的 是 i 芒 bm, 0,1) = F,。 如 同上 
个 例子 一 样 ， 必 须 推广 要 归纳 的 公式 以 提 及 函数 的 所 有 参数 。 并 不 存在 一 个 自动 的 过 程 来 实 
现 这 个 目的 ， 不 过 通过 观察 一 些 itfib(n, 0, 1) 的 计算 步骤 就 可 以 揭示 出 prev 和 curr 总 是 斐 波 那 契 
数 。 这 个 观察 使 我 们 想到 了 以 下 关系 

itfib(n, Fy, Fist) = Fien 
同样 ， 在 归纳 之 前 必须 加 上 一 个 全 称 量 词 。 
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定理 5 WHA Rn 1, itfib(n,0,1)=F,. 
HEAR 我 们 通过 对 "进行 归纳 来 证 明 下 面 的 公式 ， 然 后 令 其 中 上 = 0 就 是 要 证 明 的 结果 : 
Vk itfib(n, F, Fes) = Fyen 
由 于 ”> 1， 因 此 基本 情形 是 证 明 公 式 在 na=.1 时 成 立 : 
Vk. itfib(, Fy, Fk+1) = Freya 
从 itfib 的 定义 可 以 立即 得 到 这 个 结论 。 
对 于 归纳 步 又 来 说 ， 归 纳 假设 已 经 在 上 面 给 出 ， 接 下 来 必须 证 明 
Vk. itfib(n + 1, Fr, Fk+1) = From 


我 们 通过 简化 左 式 来 证 明 : 
itfib(n + 1, Fg, Feat) 
= iffib(n, Fk+1, Fy + Feat) [itfib] 
= itfib(n, Fr4i, Fk+2) [ 斐 波 那 契 ] 
= Fastin [归纳 假设 ] 
= ZK+O+D) [算术 ] 
应 用 归纳 假设 的 时 候 将 k 换 成 + 1， 这 使 用 到 了 全 称 量词 。 口 





这 个 证 明显 示 了 斐 波 那 契 数 是 怎样 依次 生成 的 。 被 归纳 的 公式 是 iffip 的 一 个 关键 性 质 ， 但 
很 不 明显 。 在 声明 函数 的 时 候 把 这 样 的 公式 作为 注释 标明 是 个 很 好 的 习惯 。 
舌 。 现 在 来 证 明 对 于 所 有 实数 x 和 整数 k> 1, power(x, k) = x*. BITL— Fpower (2.1447) 
的 定义 : 
fun power(x,k) : real = 
if k=1 then x 
else if k mod 2 = 0 then power (x*x, k div 2) 


else x * power(x*x, k div 2); 
> val power = fn : real * int -> real 


这 个 证明 将 假设 ML 的 实数 运算 是 精确 的 ， 忽 略 伟人 误差 。 通 常 程序 验证 都 会 忽略 物理 硬件 的 
局 限 。 想 要 展示 power 适 合 实际 的 计算 机 还 需要 一 个 误差 分 析 ， 所 涉及 的 工作 量 要 多 很 多 。 

我 们 必须 检查 power(x, 六 对 于 上 > 1 是 有 定义 的 。 对 于 k = 1 的 情形 , 这 是 显然 的 。 如 果 上 > 2， 
那么 就 需要 检查 函数 里 面 的 递归 调用 ， 它 们 将 换 成 了 k div 2。 这 一 过 程 是 会 停止 的 ， 因 为 1 < 
kdiv2 <k. 

由 于 x 在 power(x, ) 的 计算 过 程 中 不 断 变 化 ， 所 以 被 归纳 的 公式 必须 含有 一 个 量词 : 

Vx. power(x, k) = xX 

但 是 普通 的 数学 归纳 法 在 这 里 就 不 合适 了 。 在 power(x, 有 中 的 递归 调用 将 k 换 成 了 k div 2 而 不 
是 k 一 1。 我 们 要 使 用 完全 归纳 法 来 得 到 关于 k div 2 的 归纳 假设 。 
定理 6 tT HA KKK 1, AVx.power(x,k) =x, 
证 明 通过 对 /进行 完全 归纳 来 证 明 这 个 公式 。 
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虽然 完全 归纳 法 没有 单独 的 基本 情形 ， 不 过 要 对 k 的 情形 进行 分 析 。 由 于 k> 1， 让 我 们 分 
别 考虑 k = 1 和 k> 2 的 情形 。 
“k= 1 时 ， 要 证 明 的 是 
Vx.power(x, 1) = x' 
这 是 成 立 的 ， 因 为 power(x, 1) = x =x!。 
k> 2 时， 再 来 考虑 它 的 子 情形 。 如 果 k 是 偶数 则 k = 2;， 如 果 k 是 奇数 则 k = 2j + 1， 这 样 
的 j 是 存在 的 (也 即 t div 2)。 在 两 种 子 情形 中 都 有 1 <j <*， 因 此 对 于 /有 归纳 假设 
Vx.power(x, j) = x 
如 果 k = 2), MAK mod2=0, UR 


power(x, 2j) = power(x, j) [power] 
= (xy [归纳 假设 ] 
= i [算术 ] 
如 果 k = 27 + 1， 那么 k mod 2 = 1, 以 及 
power(x, 2j 二 1)=x x power(x’, D [power] 
=xx (ry [归纳 假设 ] 
= tl [算术 ] 
在 两 种 子 情形 中 ， 都 是 通过 以 x 替换 x 来 应 用 归纳 假设 的 。 | 口 


练习 6.4 ”验证 introot 计 算 了 整数 平方 根 (2.164). : 


练习 6.5 回忆 一 下 2.17 节 的 sgroot， 它 是 通过 牛顿 -拉夫 森 方 法 来 计算 实数 平方 根 的 。 讨 论 
验证 这 个 函数 所 涉及 到 的 问题 。 


结构 归纳 法 


数学 归纳 法 依照 自然 数 构成 的 方式 来 对 所 有 自然 数 证 明 9(n) 成 立 。 虽 然 有 无 穷 多 个 自然 
数 ， 但 是 它们 只 用 了 两 种 构造 方式 : l 

。0 是 一 个 自然 数 ; 

。 如 果 k 是 自然 数 ， 那 么 k+ 1 也 是 。 
严格 地 说 ， 我 们 应 该 引入 后 继 函 数 swc ， 然 后 将 上 式 重 写 为 : 

。 如 果 k 是 自然 数 ， 那 么 suc(k) 也 是 。 
接 下 来 ， 加 法 和 其 他 算术 函数 也 可 以 基于 0 和 suc 递 归 地 定义 ， 这 两 个 符号 其 实 就 是 ML 数据 类 
型 的 构造 子 。 结 构 归 纳 法 (structural induction) 是 数学 归纳 法 在 其 他 数据 类 型 上 的 推广 ， 例 
如 表 和 树 这 样 的 类 型 。 


6.4 关于 表 的 结构 归纳 法 


假设 (xs) 是 我 们 希望 证 明 的 对 于 所 有 的 表 xs 都 成 立 的 性 质 。 设 xs 是 某 个 类 型 的 列表 ， 类 
型 为 tlist， 要 想 通 过 结构 归纳 法 证 明 g(xs)， 只 要 证 明 两 个 条 件 就 行 了 : 
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RATE). 
° AE REM TAK A CHU RAK list ys AVA Os) BGO :: ys). 
这 里 的 归纳 假设 是 fys)。 
这 个 规则 可 以 写成 如 下 形式 : 
[p(ys)] 
AD Py: ys) 
p(xs) 
结构 归纳 法 为 什么 是 合理 的 昵 ? 根 据 基 本 情形 我 们 有 9([]) 成 立 。 而 根据 归纳 步骤 ， 对 于 所 有 
的 y， 又 有 9[y]) 成 立 ， 也 就 是 说 结论 对 于 所 有 单元 素 表 都 成 立 。 再 次 使 用 归纳 步骤 ， 结 论 对 
于 两 个 元 素 的 表 也 成 立 。 继 续 这 一 过 程 ， 则 可 以 证 明 结 论 xs) 对 于 所 有 的 -元 素 表 都 成 立 ; 
所 有 (该 类 型 ) 的 表 最 终 都 会 被 顾及 到 。 这 一 规则 也 可 以 通过 对 表 的 长 度 应 用 数学 归纳 法 来 
证 明 。 
为 了 说 明 这 条 规则 ， 让 我 们 来 证 明 表 的 一 个 基本 性 质 。 
定理 7 所 有 的 表 都 不 等 于 自己 的 表 尾 。 
TER 这 条 定理 可 以 形式 化 为 


限制 条 件 : y 和 ys 不 能 出 现在 Wy :: ys) 的 其 他 假设 中 。 


VXX:: XS EXS 
我 们 通过 对 表 xs 应 用 结构 归纳 法 来 证 明 。 
基本 情形 ，Vx.[x] + []， 根 据 表 相等 的 定义 显然 成 立 。 两 个 表 是 相等 的 当 且 仅 当 它们 具有 
相同 的 长 度 且 对 应 的 元 素 也 相等 。 
在 归纳 步骤 中 ， 假 定 归纳 假设 
Vax ii ys# ys 
成 立 ， 并 (对 于 任意 的 y 和 ys) 证 明 
Vx (yi ys5) Ky sys 
根据 表 相 等 的 定义 ， 只 要 证 明 两 边 的 表 尾 不 等 就 够 了 : 也 就 是 证 明 y :: ys ys。 这 就 是 归 
纳 假设 ， 只 要 将 其 中 受 全 称 量词 约束 的 x 换 成 ? 即 可 。 我 们 再 次 看 到 在 归纳 公式 中 量词 是 必 
要 的 。 口 
这 个 定理 并 不 适用 于 无 穷 表 ， 因 为 [1, 1, 1, .…] 等 于 它 自己 的 表 尾 。 这 里 给 出 的 结构 归纳 法 
规则 只 对 有 限 对 象 成 立 。 在 论 域 理 论 中 ， 归 纳 法 可 以 推广 到 无 穷 表 ， 但 不 是 对 任何 公式 都 
行 ! 这 个 限制 是 很 复杂 的 ， 简 单 地 说 ， 结 论 对 于 无 穷 表 成 立 的 必要 条 件 是 : 归纳 公式 必须 是 
若干 等 式 的 合 取 式 。 因 此 对 于 无 穷 表 z :: xs xs 是 不 能 被 证 明 的 。 
下 面 来 证 明 第 3 章 中 的 一 些 表 函数 定理 。 其 中 的 每 个 函数 对 于 所 有 输入 都 是 可 以 终止 的 ， 
因为 每 个 递归 调用 都 使 用 了 更 短 的 表 。 
表 的 长 度 : 


fun nlength [] = 0 
| nlength (x::xs) = 1 + nlength xs; 


连接 两 个 表 的 中 组 操作 符 8: 
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fun [] @ ys = ys 
| (x::xs) @ ys = x :: (xs@ys); 
朴素 的 翻转 函数 : 


fun nrev [] = [ 
= ( 


] 
| nrev (x: :xs) nrev xs) @ [x]; 


一 种 高 效 的 翻转 函数 : 


fun revAppend ([]， ys) = ys 
| revAppend (x::xs, ys) = revAppend (xs, x: :ys); 


长 度 和 追加 。 下 面 是 关于 两 个 表 连 接 以 后 的 长 度 的 一 个 明显 性 质 。 
定理 8 WHAM Axsheys, Anlength(xs @ ys) = nlength xs + nlength ys, 


证 明 对 xs 进行 结构 归纳 。 我 们 不 去 改变 这 个 变量 的 名 字 ， 以 便 上 面 的 公式 可 以 直接 作为 归纳 
假设 。 


基本 情形 是 
nlength({] @ ys) = nlength{] + nlength ys 
这 是 成 立 的 ， 因 为 
nlength([] @ ys) = nlength ys [@] 
= 0 + nlength ys [算术 ] 
= nlength{] + nlength ys [nlength] 


关于 归纳 步骤 ， 假 定 上 面 的 归纳 假设 ， 并 证 明 对 于 所 有 x 和 xs， 有 
nlength((x :: xs) @ ys) = nlength(x :: xs) + nlength ys 


这 是 成 立 的 ， 因 为 
nlength((x :: xs) @ ys) 
= nlength(x :: (xs @ ys)) [@] 
= | + nlength(xs @ ys) [nlength] 
= 1+ (nlength xs + nlength ys) [归纳 假设 ] 
= (1 + nlengthxs) + nlength ys [结合 律 ] 
= nlength(x :: xs) + nlength ys [nlength] 
也 可 以 通过 直接 写 1 + nlength xs + nlength ys， 而 省 去 其 中 的 括号 ， 来 避免 显 式 使 用 结合 律 。 
| i” 


这 个 证 明 带 出 了 插入 表 元 素 和 对 它们 进行 计数 之 间 的 对 应 关系 。 对 xs 进 行 妇 纳 之 所 以 可 
行 ， 是 因为 基本 情形 和 归纳 步骤 都 可 以 利用 函数 的 定义 进行 简化 。 对 ys 进行 归纳 是 没有 结果 
的 : 不 信 可 以 试 试 。 

高 效 的 表 翻 转 。 国 数 nrev 是 表 翻 转 的 数学 定义 ， 而 rev4ppend 则 可 以 高 效 地 对 表 进 行 翻转 。 
两 个 函数 等 价 的 证 明 类 似 于 定理 4，facii 的 正确 性 证 明 。 在 两 个 证 明 中 ， 归 纳 公式 中 的 累加 参 
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数 都 要 通过 全 称 量 词 进行 约束 。 
定理 9 对 于 所 有 的 表 xs， 都 有 Vys.rev4ppend(xrs, ys) = nrev(xs) @ ys. 
证 明 我 们 对 xs 进行 结构 归纳 ， 以 上 面 的 公式 作为 归纳 假设 。 基 本 情形 是 
Vys . revAppend([], ys) = nrev[] @ ys 
这 是 成 立 的 ， 因 为 revAppend([], ys) = ys = [] @ ys = nrev[] @ ys. 
归纳 步骤 是 ， 对 于 任意 的 x 和 xs ， 证 明 
Vys .revAppend(x :: xs, ys) = nrev(x :: xs) @ ys 
简化 等 式 的 右边 ， 得 到 
nrev(x :: xs) @ ys = (nrev(xs) @ [x]) @ ys 
简化 左边 得 到 
revAppend(x :: xs, ys) = revAppend(xs, x :: ys) 
= nrev(xs) @ (x :: ys) 
= nrev(xs) @ ([x] @ ys) 
归纳 假设 的 使 用 是 通过 将 全 称 量词 约束 的 变量 ys 替换 成 x :: xs 来 进行 的 。 
证 明 完 成 了 吗 ? 还 没有 : 两 式 的 括号 并 不 一 致 。 还 需要 证 明 
nrev(xs) @ ({x] @ ys) = (nrev(xs) @ [x]) @ ys 


[nrev] 


[revAppend] 
[归纳 假设 ] 
[@] 


这 个 公式 看 上 去 比 当初 设 定 要 证 明 的 那个 复杂 。 接 下 来 该 怎么 办 呢 ? 仔细 观察 就 会 发 现 它 是 


一 个 既 简单 而 又 应 该 成 立 的 结论 的 特例 : @ 是 满足 结合 率 的 。 我 们 只 要 证 明 


h@h@eh=@he@kh 
这 个 归纳 证 明 只 不 过 是 例行公事 ， 我 们 留 作 练习 。 


口 


按 正 确 顺 序 证 明 的 每 个 定理 都 将 会 显得 更 加 整洁 ， 使 演示 变 得 完美 。 这 个 例子 试图 说 明 
的 是 ， 怎 样 发 现 对 一 个 定理 的 需要 。 在 验证 中 ， 最 困难 的 问题 就 是 认识 到 需要 证 明 什 么 样 的 
性 质 。 对 结合 律 的 需要 在 这 里 是 很 明显 的 ， 但 当 我 们 被 眼花 纤 乱 的 符号 所 迷惑 时 就 不 一 定 了 ， 


而 这 又 是 很 容易 发 生 的 事 。 
追加 和 翻转 。 现 在 我 们 来 证 明 一 个 涉及 表 的 连接 和 翻转 的 关系 。 
定理 10 对 于 所 有 表 xs 和 ys， 有 nrev(xs @ ys) = nrev ys @ nrev xs, 
证 明 对 xs 进 行 结构 归纳 。 基 本 情形 是 
nrev([] @ ys) = nrev ys @ nrev[] 


可 以 利用 引 理 ! @ 0] = ! 来 证 明 它 是 成 立 的 ， 这 个 引 理 留 作 练习 。 
归纳 步骤 是 


nrev((x :: xs) @ ys) = nrev ys @ nrev(x :: xs) 


这 是 成 立 的 ， 因 为 
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nrev((x :: xs) @ ys) = nrev(x :: (xs @ ys)) [@] 
= nrev(xs @ ys) @ [x] [nr ev] 
= nrev ys @ nrev xs @ [x] [归纳 假设 ] 


= nrev ys @ nrev(x :: xs) [nrev] 


在 nrev ys @ nrev xs @ [如 中 ， 我 们 通过 省 去 括号 隐 式 地 使 用 了 @ 操 作 的 结合 律 。 口 
上 面 两 个 定理 说 明了 nrev， 虽 然 计算 起 来 很 低 效 ， 却 是 一 个 不 错 的 翻转 描述 。 它 令 证 明 变 
得 很 简单 。 一 个 文字 上 的 描述 ， 像 
reverse [Xi1, X2, ..., Xn] = [Xn ..., X2, X1] 
最 难 形式 化 。 函 数 rev4ppend 也 不 是 一 个 好 的 描述 ， 它 太 复杂 了 ， 并 且 它 的 性 能 对 于 描述 是 无 
关 的 。 不 过 niength 却 是 表 长 度 的 一 个 好 描述 。 
练习 6.6 通过 结构 归纳 法 证 明 ， 对 于 所 有 表 xs， 有 xs @ [= xs. 
练习 6.7 ”通过 结构 归纳 法 证 明 ， 对 于 所 有 表 /)、P 和 5， 有 1 @ (ls@ 4b)= (1@1)@b。 
练习 6.8 证 明 对 于 所 有 表 xs， 有 mrev(arev xs) = xs. 
练习 6.9 证 明 对 于 所 有 表 xs 都 有 nlength xs = length xs. ( 函数 length 是 在 3.4 节 定义 的 。) 


6.5 关于 树 的 结构 归纳 法 
在 第 4 章 我 们 研究 了 如 下 定义 的 二 又 树 : 


datatype ʻa tree = Lf 
` | Br of 'a * 'a tree * 'a tree; 

二 叉 树 容许 结构 归纳 。 在 多 数 情况 下 ， 对 它们 的 处 理 类 似 于 对 表 的 处 理 。 假 设 p(D) 是 树 的 一 个 
性 质 ， 其 中 具有 类 型 rtree。 要 通过 结构 归纳 法 证 明 gKt)， 只 要 证 明 两 个 条 件 : 

BARE EOL. 

“归纳 步骤 是 ， 要 证 明 对 于 所 有 类 型 为 z 的 元 素 x 以 及 类 型 为 r tree RA MRA, OA 

Pte) SM Br(x, th, 12))。 这 里 有 两 个 归纳 假设 4) 和 U12)。 
这 个 规则 可 以 写成 如 下 形式 : 


(p(t), H(t, )] 
Uf) 9(Br(x, t, h)) 
pe) 


这 一 结构 归纳 规则 是 合理 的 ， 因 为 它 概 括 了 所 有 构造 树 的 方法 。 基 本 情形 建立 了 KL。 应 用 一 
次 归纳 步 又 则 对 于 所 有 zx 建立 了 WBr(xz, Lf, [有 )， 这 概括 了 所 有 包 贪 一 个 Br 结 点 的 树 。 应 用 两 次 
归纳 步骤 建立 了 4D)， 其 中 it 是 包含 两 个 Br 结 点 的 树 。 进 一 步 应 用 归纳 步骤 则 概括 了 更 大 的 树 。 

我 们 也 可 以 通过 对 树 的 标签 数目 进行 完全 归纳 来 证 明 这 个 规则 ， 因 为 每 一 棵 树 都 是 有 限 
的 ， 并 且 它 的 子 树 要 比 本 身 小 。 一 般 来 说 ， 结 构 归 纳 法 对 于 无 穷 的 树 是 不 成 立 的 。 

下 面 将 证 明 一 些 有 关 二 叉 树 函数 的 结论 ， 这 些 函 数 来 自 4.10 节 。 

树 的 标签 数目 : 

fun size Lf = 0 

| size (Br(v,tl,#2)) = 1 + size th + size 12; 


限制 条 件 : x、t, 和 ts 不 能 出 现在 HBr(x, 1, 42)) 的 其 他 假设 中 。 
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树 的 深度 : 

fun depth Lf = 0 
| depth (Br(v,tl,t2)) = 1 + Int.max(depth tl, depth t2); 

树 的 镜像 : 


fun reflect Lf 
| reflect (Br(v,tt,t2)) 


树 标 签 的 前 序 表 : 


fun preorder Lf 
| preorder (Br(v,tl,t2)) 


Lf 
Br(v, reflect t2, reflect tl); 


[] 
iv] @ preorder tì @ preorder 12; 


树 标签 的 后 序 表 : 


‘fun postorder Lf = [] 
| postorder (Br(v,tl,t2)) = postorder t\ @ postorder 12 @ [v]; 


双重 镜像 。 我 们 从 一 个 简单 的 例子 开始 : 将 一 棵 树 镜像 两 次 则 得 到 原来 的 树 。 
定理 11 对 于 所 有 二 又 树 :， 有 reflect(reflect t)=t, 
证 明 对 :进行 结构 归纳 。 基 本 情形 是 
reflect(reflect Lf) = Lf 
根据 reflect 的 定义 这 是 成 立 的 : reflect(reflect Lf) = reflect Lf = Lf. 
对 于 归纳 步骤 ， 我 们 有 两 个 归纳 假设 
reflect(reflect t) =t, H. reflect(reflect to) = ft 
而 且 必须 证 明 | 
reflect(reflect(Br(x, tı, t2))) = Br(x, tı, t2) 
我 们 来 进行 简化 
reflect(reflect(Br(x, t, t2))) 
= reflect(Br(x, reflect t,, reflect t,)) 
= Br(x, reflect(reflect tı), reflect(reflect 1,)) 


= Br(x, tı, reflect(reflect t,)) 
= Br(x, ty, tr) 


[reflect] 
[reflect] 
[归纳 假设 ] 
[归纳 假设 ] 
两 个 归纳 假设 都 使 用 到 了 。 可 以 看 到 两 次 reflect 调 用 互相 抵消 了 。 口 
前 序 和 后 序 。 如 果 你 对 前 序 和 后 序 的 概念 不 很 清楚 的 话 ， 下 面 的 定理 可 能 会 有 所 帮助 。 
关于 mrev 和 @ 的 定理 10 是 很 关键 的 结论 ， 在 前 面 已 经 证 明 过 了 。 
定理 12 对 于 所 有 二 叉 树 !f， 有 Postorder(reflect t) = nrev(preorder t), 
证 明 对 :进行 结构 归纳 。 基 本 情形 是 
postorder(reflect Lf) = nrev(preorder Lf) 
证 明 这 个 只 不 过 是 例行公事 ; 两 边 都 等 于 []。 
对 于 归纳 步骤 ， 我 们 有 归纳 假设 
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postorder(reflect t,) = nrev(preorder t,) 


postorder(reflect t,) = nrev(preorder t) 


接着 必须 证 明 
postorder(reflect(Br(x, t,, tz))) = nrev(preorder(Br(x, ty, t2))) 
首先 简化 右 式 : 
nrev(preorder(Br(x, t1, t))) 
= nrev([x] @ preorder t, @ preorder t) [preorder] 
= nrev(preorder t,) @ nrev(preorder t,) @ nrev[x} [定理 10] 
= nrev(preorder t) @ nrev(preorder t,) @ [x] [nrev] 


中 间 跳 过 了 一 些 步 骤 。 分 别针 对 每 一 个 @ 操 作 符 ， 应 用 了 两 次 定理 10， 并 且 nrev[x] 直 接 简化 
mT [x]. i 
现在 再 来 简化 左 式 : 


postorder(reflect(Br(x, ty, t2))) 
= postorder(Br(x, reflect t,, reflect t,)) 


[reflect] 
= postorder(reflect t) @ postorder(reflect t,) @ [x] [postorder] 
= nrev(preorder t) @ nrev(preorder t,) @ [x] [归纳 假设 ] 

由 此 可 见 ， 等 式 的 两 边 是 相等 的 。 口 


计数 和 深度 。 现 在 来 证 明 一 个 有 关 二 又 树 标 答 个 数 和 深度 之 间 关 系 的 定律 。 这 条 定理 是 
个 不 等 式 ， 这 也 提示 了 形式 方法 不 仅仅 只 涉及 等 式 。 
定理 13 对 于 所 有 二 又 树 :， 有 size 1 < 24Ph' 一 1。 
证 明 对 进行 结构 归纳 。 基 本 情形 是 
size Lf < 24" f — 1 
这 是 成 立 的 ， 因 为 size Lf =0 = 29-1 = 2*P*Y — 4, 
在 归纳 步骤 中 ， 归 纳 假设 是 


size t,< 2%" — 1 H size n < 2th 一 1 


并 且 我 们 必须 说 明 
size(Br(x, ti, t2)) < 2EPME nD — 1 
首先 简化 右 式 : 
qdepth(Br(x,ti,t2)) _ q 一 i+max(depth ty deptht2) _ 1 [depth] 
— 2 x pmax(depthn depthn) _ 4 [算术 ] 
然后 证 明 左 式 小 于 或 等 于 这 个 结果 : 
size (Br(x, tı, t2)) = 1 + size ty + size tz [size] 
< 1+ (2%Pihn -1) 十 (2dpmea _ 1) [归纳 假设 ] 
= qdepthn + qdepth tr —1 [算术 ] 


< 2 x 2max(deptndepma) 1 [算术 ] 
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上 上面， 我 们 将 取 两 个 整数 中 最 大 值 的 数学 函数 max 看 成 和 库 函 数 Int. max 一 样 。 口 


O 有 问题 的 数据 类型 。 我 们 的 这 些 简单 方法 并 不 能 适用 所 有 的 ML 类 型 。 不 妨 考虑 
下 面 的 数据 类 型 声明 : 
datatype lambda = F of lambda -> lambda; 

本 章 的 数学 是 基于 集合 论 的 。 由 于 不 存在 一 个 集合 4 和 浮 数 A 一 A 的 集合 同 构 ， 因 
此 我 们 搞 不 清楚 这 个 声明 的 意义 。 在 论 域 理论 中 ， 这 个 声明 是 可 以 解释 的 ， 因 为 存 
在 论 域 D 同 构 于 DD， 后 者 是 从 DD 到 DD 的 连续 (continuous) 函数 的 论 域 。 即 便 是 在 
论 域 理论 中 ， 也 没有 找到 址 合 论证 D 的 归纳 原则 。 这 是 因为 该 类 型 定义 涉及 到 函数 匡 
k (=) 左 侧 的 递归 。 我 们 将 不 考虑 涉及 到 函数 的 数据 类 型 。 | 

在 项 的 类 型 term (5.11 节 ) 里 引用 了 表 : 


datatype term = Var of string 
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| Fun of string * term list; 


类 型 Jerm 表 示 了 项 的 有 限 集 合 ， 它 满足 结构 归纳 的 原则 。 然 而 ， 类 型 中 涉及 到 了 表 使 
得 理论 和 证 明 变 复杂 了 (Paulson, 1995, 4.47). 


练习 6.10 
练习 6.11 
练习 6.12 
练习 6.13 
练习 6.14 


形式 化 并 证 明 : 任何 二 又 树 都 不 等 于 它 自己 的 左 子 树 。 

证 明 对 于 所 有 二 叉 树 t，size(reflect t) = size t. 

证 明 对 于 所 有 二 叉 树 :，nlength(preorder t) = size t. 

证 明 对 于 所 有 二 叉 树 t，nrev(inorder(reflect t)) = inorder t, 

定义 一 个 函数 leaves 来 计算 一 棵 二 又 树 中 的 Lf 结 点 。 然 后 证 明 对 于 所 有 二 又 树 1， 


leaves t = size t+ 1. 


练习 6.15 验证 4.11 节 的 函数 preord。 换 名 话 说 ,证 明 对 于 所 有 二 又 树 +，preord(t, []) = 


preorder t, 


6.6 函数 值 和 算 子 


我 们 的 数学 方法 可 以 直接 扩 虹 到 高 阶 函 数 〈 算 子 ) 的 证 明 。“ 函数 作为 值 ” 的 记 法 对 于 
数学 家 来 说 是 非常 熟悉 的 。 例 如 ， 在 集合 论 中 ， 函 数 被 看 成 是 集合 ， 并 且 和 其 他 集合 没什么 


区 别 。 


我 们 可 以 证 明 很 多 关于 算 子 的 事实 ， 而 不 需要 增加 任何 规则 。 我 们 也 可 以 引入 入 -演算 的 
定律 来 对 ML 的 fn 记 法 进行 论证 ， 不 过 这 里 就 不 进行 了 。 我 们 的 方法 ， 毫 无 疑问 ， 只 适用 于 纯 
函数 ， 而 不 是 那些 有 副作用 的 ML 函数 。 

总数 的 相等 。 外 迁 原 则 (law of extensionality) 是 说 ， 如 果 对 于 所 有 x (具有 合适 的 类 型 )， 
有 f(x) = g(x)， 那 么 函数 1 和 g 就 是 相等 的 。 例 如 ， 下 面 的 三 个 函数 是 外 延 相等 的 : 


fun doublel (n) = 
fun double2(n) = n*2; 
fun double3(n) = 


2*n; 


(n-1)+(n+1); 


外 延 原则 之 所 以 有 效 是 因为 一 个 ML 函数 所 进行 的 操作 就 是 应 用 到 实际 参数 上 。 将 替换 成 8， 
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如 果 它 们 是 外 延 相 等 的 话 ， 不 会 影响 任何 了 的 应 用 。 。 

男 一 种 不 同 的 相等 概念 ， 称 为 内 涵 相 等 (intensional equality ) ， 认 为 两 个 函数 只 有 当 它 们 
的 定义 一 样 的 时 候 才 相等 。 我 们 的 三 个 加 们 函数 在 内 涵 相 等 的 意义 下 是 互 不 相同 的 。 这 个 概 
念 类 似 于 Lisp 中 的 函数 相等 ， 在 这 种 语言 中 函数 值 是 一 段 可 以 取出 的 Lisp 代 码 。 

并 没有 一 种 通用 的 、 可 计算 的 方法 来 测试 两 个 函数 是 否 外 延 相等 。 因 此 ML 对 于 函数 值 是 
没有 相等 测试 的 。Lisp 通 过 比较 函数 的 内 部 表示 来 测试 它们 是 否 相等 。 

我 们 现在 来 证 明 几 个 关于 函数 复合 (中 缀 操作 符 o) 和 算 子 map (5.7 节 ) 的 命题 。 

fun (foglx= (g x); 


fun map f U) = [] 
| map f (x::xs) = (f x) :: map f xs; 


复合 的 结合 性 。 我 们 的 第 一 个 定理 是 显然 的 。 它 断言 了 函数 复合 满足 结合 律 。 
定理 14 YFA ARS. geh (RAAEN), A 
(fog)oh=fo(goh) 
证 明 根据 外 延 原则 ， 只 要 证 明 
(fog)oh)x=(fo(goh))x 234 
对 于 所 有 的 x 都 成 立即 可 。 这 是 成 立 的 ， 因 为 
(fog) oh)x = (f og)(hx) 
= f(g(hx)) 
= f((goh)x) 
= (fo(goh))x 
每 一 步 推导 都 是 根据 复合 的 定义 。 口 
就 像 提 到 过 的 那样 ， 这 个 定理 只 对 具有 合适 类 型 的 国 数 成 立 ; 等 式 必 须 被 正确 地 定型 。 
类 型 的 限制 适用 于 我 们 所 有 的 定理 ， 以 后 就 不 再 提 及 了 。 


表 算 子 map。 算 子 满足 很 多 定律 。 下 面 是 一 个 关于 map 和 函数 复合 的 定理 ， 它 可 以 用 于 和 避 
免 产 生 中 间 表 。 


定理 15 对 于 所 有 函数 太 和 8， 有 map fomap g=map(f-g), 
证 明 根据 外 延 原 则 ， 当 对 于 所 有 表 xs， 有 
(mapf o mapg) xs =(map (f o g))xs 
时 ， 所 要 证 明 的 等 式 成 立 。 利 用 o 的 定义 ， 上 式 可 以 简化 为 
map f (map g xs) = map (f 0 g) xs 
由 于 xs 是 一 个 表 ， 我 们 可 以 使 用 结构 归纳 法 。 上 面 的 式 子 也 就 是 归纳 假设 。 基 本 情形 是 


日 ”外 延 原则 依赖 于 我 们 对 于 函数 是 可 终止 的 总 体 假设 。ML 区 分 1 (无 定义 的 函数 值 ) Mxd (在 应 用 时 不 
能 终止 的 函数 )， 虽 然 这 两 个 函数 应 用 到 任何 参数 上 时 都 返回 上。 
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BOX 
map f (map g []) = map f og) 0] 
这 是 成 立 的 ， 因 为 两 边 都 等 于 [ ]: 
map f (map g{]) = mapf {] = {] = map (f o g) [] 
MFASR, BEIABRERIL., HEH (对 于 任意 x 和 xs) 
map f (map g (x :: xs)) = map (f o g) (x :: xs) 
直接 论证 即 有 
map f (map g (x :: xs)) 
= mapf & x) :: (map g xs)) [map] 
= f(g x) :: (map f (map g xs)) [map] 
= f (8 x) :: (map (f o g) xs) [归纳 假设 ] 
= (f o g)(x) :: (map (f o g) xs) [o] 
= map (f o g) (x :: xs) [map] 
尽管 出 现 了 国 数值 ， 这 也 只 是 个 例 行 的 结构 归纳 证 明 。 口 
表 算 子 fold1。 算 子 foldl 对 表 元 素 应 用 了 一 个 2- 参 数 的 函数 。 回 忆 一 下 5.10 节 的 定义 : 
fun foldl f e [] = e 


| fold f e (x::xs) = foldl f (f(x, e)) xs; 
如 果 @@ 是 一 个 满足 结合 律 的 操作 符 ， 那 么 joldl(op ©) (y © z) xs = ( foldl (op ®) yxs)@z. A 
为 ， 如 果 xs = [x X, ,xz]， 这 就 等 价 于 
Xn B+: (2 © 1 BY @2Z)))--- = xn @--- BH GS y)) @z 


由 于 @ 满 足 结合 律 ， 我 们 可 以 去 掉 所 有 的 括号 ， 将 两 边 都 简化 成 mw 四 … OxnOx1OyOz. 我 
们 可 以 看 到 使 用 中 组 操作 符 田 ， 而 不 是 函数 了 记 法 的 优点 。 现 在 来 看 看 正式 的 证 明 。 


定理 16 ”假设 田 是 一 个 中 缓 操作 待 ， 并 满足 结合 律 ， 即 对 于 所 有 xz、y 和 z, 有 x@O@azD= 
四 尹 田 z。 则 对 于 所 有 >、z 和 xs， 有 


Vy .foldl (op®) (y ® z) xs = (foldl (Op®@) yxs) Bz 
证 明 对 表 xs 进 行 结构 归纳 。 基 本 情形 ， 


foldl (op®) O ® 2) [] = (fold! (op®) y [)) Bz 
是 显然 的 ， 两 边 都 可 简化 成 y © z. 
对 于 归纳 步 晴 ， 我 们 证 明 
foldl (op®) O ® 2) (x :: xs) = (foldi (op®) y (x :: xs)) BZ 
对 于 任意 的 y、x 和 xs: | : 


foldl (op®) (y ® 2) (x :: xs) 
= foldl (op®) (x ® O @ z)) xs [foldl] 
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= foldl (op®) ((x ® y) ® z) xs [结合 律 ] 
= (foldi (op®) (x ® y) xs) ®z | [归纳 假设 ] 
= (foldl (op®) y (x :: xs)) z [olal] 
归纳 假设 是 通过 用 x © y 去 替换 全 称 量词 约束 的 变量 来 应 用 的 。 Oo 


练习 6.16 证 明 map f (xs @ ys) = (map f xs) @ (map f ys). 
练习 6.17 证 明 (map f)onrev=nrevo(map f). 
练习 6.18 声明 一 个 二 又 树 算 子 maptree， 要 求 满 足下 列 等 式 (并 给 出 证 明 ): 

(maptreef) o reflect = reflect o (maptree f) 

(map f) o preorder = preorder o (maptree f) 
练习 6.19 证 明 foldr (op ::) ys xs = xs @ ys. 
练习 6.20 证 明 foldl fz (xs @ ys) = foldl f (foldl f z XS) yso 
练习 6.21 假设 @ 和 e 满 足 对 于 所 有 x、?y 和 z， 有 
xO(yOz) =(xOy)Oz H eOx=x 

4FAfoldr (opo WAS. AMF MAYM, A(FelOy=Fyl. 


练习 6.22 ”承接 上 一 练习 的 @ CHF. CMMRCHG(, 2) =F zl. 证明 对 于 所 有 二 有 foldr 
Ge ls = F e (map (F e) Is). 


一 般 性 归纳 原理 


在 表 的 结构 归纳 证 明 中 ， 我 们 假定 Wxs) 成 立 ， 然 后 证 明 4x :: xs)。 通 常 归纳 公式 涉及 了 一 
个 递归 的 表 国 数 ， 如 nrev。 归 纳 假设 ，Wxrs)， 包 含 了 关于 mrev(xs) 的 叙述 。 由 于 mrevCxr :: xs) 是 
基于 mrev(xs) 定 义 的 ， 因 此 我 们 可 以 通过 论证 mrev(z :: xs) RUE :: xs)。 

表 函 数 nrev 对 于 参数 的 尾部 进行 了 递归 调用 。 这 种 仿照 结构 归纳 法 的 递归 调用 被 称 作 结构 
递归 Ce recursion)。 然 而 ， 递 归 函 数 可 以 通过 其 他 方式 来 缩短 表 。 函 数 maxl!， 当 应 用 
到 m :: n: ns 上 时 ， 可 能 会 在 m :: ns 上 调用 自己 : 

fun maxl [m] : int =m 

| mad (m::n::ns) = if m>n then maxl(m: :ns) 
else maxl(n: :ns); 
快速 排序 和 合并 排序 都 是 将 表 划 分 成 两 个 更 小 的 表 并 递归 地 将 它们 排序 。 和 矩阵 转 置 (3.9 节 ) 
和 高 斯 消 元 法 则 对 通过 删除 行 和 列 而 得 到 的 更 小 的 矩阵 进行 递归 调用 。 


大 多 数 的 树 函 数 都 使 用 结构 递归 : 它们 的 递归 调用 涉及 了 一 个 结 点 的 直接 子 树 。 将 命题 


转换 成 否定 范式 的 函数 nnf 就 不 是 结构 递归 的 了 。 我 们 在 这 一 节 将 要 证 明 关于 nnf 的 定理 。 

-结构 归纳 法 很 适合 结构 递归 函数 。 对 于 其 他 函数 ， 良 基 归 纳 法 (well-founded induction) 
通常 更 优胜 。 良 基 归 纳 是 完全 归纳 的 一 个 有 力 推广 。 由 于 它 的 规则 是 抽象 的 ， 并 且 很 少 用 于 
完全 一 般 的 情况 下 ， 因 此 我 们 的 证 明 将 通过 一 个 特殊 情形 来 进行 : 对 大 小 进行 归纳 。 例 如 ， 
函数 nleng 纪 对 表 的 大 小 进行 了 形式 化 。 在 归纳 步 又 中 ， 我 们 需要 证 明 Wxs)， 依 据 的 归纳 假 
设 是 
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Vys .nlengthys < nlengthxs —> o(ys) 
Ala iia Kyse, BTR BR Os) MI AT T - 
6.7 计算 范式 
我 们 的 重 言 式 检测 器 使 用 函数 来 计算 命题 的 范式 〈4.19 节 )。 这 些 函 数 涉及 到 了 不 寻常 的 
递归 ; 结构 归纳 法 看 来 不 太 合适 了 。 首 先 让 我 们 来 重 温 一 些 定义 。 


datatype prop = Atom of String 
| Neg of prop 
| Conj of prop * prop 
| Disj of prop * prop; 


函数 myjf 计 算 一 个 命题 的 否定 范式 。 它 实际 上 直接 叙述 了 这 个 范式 的 重 写 规则 ， 因 而 包含 了 复 


fun nnf (Atom a) Atom a 
nnf (Neg (Atom a)) Neg (Atom a) 
nnf (Neg (Neg p)) nnf p 


nnf (Neg (Conjip.q))) 
nnf (Neg (Disj(p.q))) 
nnf (Conj(p,q)) 
nnf (Disj(p.q) ) 


nnf (Disj (Neg p, Neg q)) 
nnf (Conj (Neg p, Neg q)) 
Conj (nnf p, nnf q) 
Disj (nnf p, nnf q); 


相互 递归 的 函数 nnfpos 和 nnfneg 计 算 同 样 的 范式 ， 不 过 更 加 高 效 : 


fun nnfpos (Atom a) 
| nnfpos (Neg p) 
| nnfpos (Conj(p.q)) 
| nnfpos (Disj(p,9)) 
and nnfneg (Atom a) 
| nnfneg (Neg p) 
| nnfneg (Conj (p,q)) 
| nnfneg (Disj(p,9)) 


no nm Ww Wd ok N 


Atom a 

nnfneg p 

Conj (nnfpos p, nnfpos q) 
Disj (nnfpos p, nnfpos q) 
Neg (Atom a) 

nnfpos p 

Disj (nnfneg p, nnfneg q) 
Conj (nnfneg p, nnfneg q); 


我 们 必须 证 实 这 些 函 数 是 可 以 终止 的 。 函 数 nnfpos 和 nnfneg 是 结构 递归 的 ， 也 就 是 说 ， 递 归 总 
是 应 用 在 参数 的 直接 组 成 部 分 上 ， 因 此 它们 是 可 以 终止 的 。 对 于 nnf 来 说 ,终止 就 不 是 那么 明 
显 的 了 。 考 虑 一 下 nnf (Neg(Conj(p, 9)))， 它 的 递归 调用 是 作用 在 更 大 的 表达 式 上 的 。 不 过 ， 
经 过 几 步 之 后 就 会 简化 成 


nn 


Disj(nnf (Neg p), nnf (Neg q)) 


因此 ， 在 Neg(Conj(p, q)) 之 后 的 递归 调用 涉及 的 是 较 小 的 命题 Neg p 和 Neg 4。 另 一 个 较 复杂 的 
模式 ，Neg(Disj(p, 9))， 也 与 此 类 似 。 在 每 一 种 情况 下 ，nnf 中 的 递归 计算 所 涉及 到 的 命题 都 
会 越 来 越 小 ， 因 此 它 是 可 以 终止 的 。 

我 们 来 证 明 nnfpos 和 nnf 是 相等 的 。 刚 才 对 于 终止 的 讨论 提示 了 关于 nnf p 的 定理 应 该 通过 
对 p 的 大 小 进行 归纳 而 证 明 。 我 们 用 nodes(p) 来 表示 p 里 面 的 Neg、Comj 和 Disj 结 点 的 个 数 。 这 
个 函数 在 ML 里 面 不 难 编写 。 





why BHA AZ AP G7 aE 183 


定理 17 对 于 所 有 命题 p， 有 nnfp = nnfpos p。 
证 了 明 ”对 nodes(p) 进 行 完 全 归纳 ， 归 纳 假设 是 ， 对 于 所 有 gq， 只 要 nodes(q) < nodes(p) 就 有 nnf q 
= nnfpos 9。 对 应 于 nn 的 定义 ， 我们 考虑 7 种 情形 。 
如 果 p = Atom a， 那 么 nnf (Atom a) = Atom a = nnfpos (Atom a). 
如 果 p = Neg(Atom a), BRA 
nnf (Neg(Atom a)) = Neg(Atom a) = nnfpos(Neg(Atom a)) 


如 果 p = Conj(r, 9)， 那 么 


nnf (Conj(r, q)) = Conj(nnf r, nnf q) [nnf] 
= Conj(nnfpos r, nnfpos q) [归纳 假设 ] 
= nnfpos(Conj(r, q)) [nnfpos] 


情形 p = Disj(r, 9) 与 此 类 似 。 
如 果 p = Neg(Conj(r, 9))， 那 么 


nnf (Neg(Conj(r, q))) = nnf (Disj(Neg r, Neg q)) [anf] 
= Disj(nnf (Neg r), nnf (Neg q)) [nnf] 
= Disj(nnfpos(Neg r), nnfpos(Neg 9)) [归纳 假设 ] 
= nnfneg(Conj(r, q)) (nnfneg] 
= nnfpos(Neg(Conj(r, q))) [nnfpos] 


对 Neg r 和 Neg q 应 用 归纳 假设 是 因为 ， 当 用 nodes 测 量 时 ， 它 们 比 Neg(Conj(r, 9)) 要 小 。 
情形 p = Neg(Disj(r, 9)) 与 此 类 似 。 
如 果 p = Neg(Neg r), BBA 


nnf (Neg(Neg r)) = nnf r [nnf] 

= nnfposr [归纳 假设 ] 

= nnfneg(Neg r) [nnfneg) 

= nnfpos(Neg(Neg r)) [nnfpos] 

这 里 ， 因 为 r 包 含 的 结 点 比 Neg(Neg 7?) 更 少 ， 所 以 可 以 应 用 归纳 假设 。 口 


合 取 范式 。 现 在 来 考虑 另 一 个 问题 : 合 取 范式 的 计算 是 否 保 持 了 命题 的 含义 。 命 题 的 真 
值 指派 (truth valuation) 是 一 个 遵守 下 面 关 系 的 谓词 : 
Tr(Negp) <> —Tr(p) 
Tr(Conj(p, q)) © Trp) ^ Tr(q) 
Tr(Disj(p, q)) <> Trp) v Tr(a) 


这 个 谓词 完全 由 其 对 原子 的 指派 7r(4rom a) 决 定 。 为 了 证 明 范 式 对 所 有 的 指派 都 保持 了 真 值 ， 


我 们 不 对 任何 原子 的 真 值 作 假定 。 
计算 CNF 的 大 多 数 工作 是 由 distrib 完 成 的 : 
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fun distrib (p, Conj(q,r)) = Conj(distrib(p,q), distrib(p,r)) 
| distrib (Conj(q.r), p) = Conj(distrib(q,p), distrib(r,p)) 
| distrib (p, q) = Disj (p,q) O 没有 合 取 式 *); 
这 个 函数 在 情形 分 析 和 递归 调用 上 不 同 往常 。 
前 两 个 情形 有 重 登 部 分 ， 也 就 是 当 distribp, g) 的 两 个 参数 都 是 合 取 式 的 时 候 。 因 为 ML 首 
先 尝试 匹配 第 一 个 情形 ， 第 二 个 情形 不 能 简单 地 被 当 作 是 一 个 等 式 。 好 像 没 有 什么 办 法 能 将 
情形 完全 分 离 ， 除 非 书写 几乎 所 有 的 Atom、Neg、Disj 和 Conj 的 相互 组 合 : 大 概 最 少 也 得 需要 
13 种 。 为 了 避免 这 样 ， 将 disiribp 的 第 二 种 情形 作为 一 个 条 件 等 式 ; 当 p 不 具有 形式 Conj(pi, pr) 
时 ， 则 有 


distrib(Conj(q, r), p) = Conj(distrib(q, p), distrib(r, p)) 


distrib 的 计算 可 能 会 产生 改变 p 和 gq 两 者 之 一 的 递归 调用 。 计 算是 会 终止 的 ， 因 为 每 一 个 调用 都 
会 减少 aodes(p) + nodes(q) 的 值 。 我 们 将 使 用 这 个 量 来 进行 归纳 。 

distrib(p, 9) 的 任务 是 计算 出 等 价 于 Disj(p, 9) 的 命题 ， 却 又 具有 合 取 范式 的 形式 。 它 的 正 
确 性 可 以 叙述 如 下 。 


定理 18 对 于 所 有 命题 p、4 和 真 值 指 派 T7， 有 
Tr(distrib(p, q)) <> Tr(p) V Tr(q) 


证 明 ”我 们 通过 对 nodes(p) + nodes(g) 进 行 归纳 来 证 明 。 归 纳 假设 是 ， 对 于 所 有 P' 和 4 满足 
nodes(p') + nodes(q') < nodes(p) + nodes(q)， 有 
Tr(distrib(p’, q')) <> Tr(p’) V Tred’) 
证 明 中 考虑 了 和 distrib 定 义 中 相同 的 那些 情形 。 
如 果 4 = Conj(q',r), ABZ 


Tr(distrib(p, Conj(q', r))) 


<> Tr(Conj(distrib(p, q’), distrib(p, r))) [distrib] 
<> Tr(distrib(p, q')) A Tr(distrib(p, r)) [Tr] 
<> (Tr(p) V Tr(q’)) A (Tr(p) v Tr(n)) [归纳 假设 ] 
 Tr(p) V (Tr(q) 和 TD) [分 配 律 ] 
<> Trp) V Tr(Conj(q’, n) [T] 
归纳 假设 根据 下 列 事实 被 使 用 了 两 次 : 


nodes(p) + nodes(q’) < nodes(p) + nodes(Conj(q', r)) 
nodes(p) + nodes(r) < nodes(p) + nodes(Conj(q',r)) 
我 们 现在 可 以 假设 不 是 一 个 Comj。 如 果 p = Conj(p', r)， 那 么 可 以 用 与 上 面 情形 相同 的 论证 得 
到 结论 。 如 果 p 和 gq 都 不 是 一 个 Conj， 那 么 
Tr(distrib(p, q)) © Tr(Disj(p, 9)) [distrib} 
~ Tr(p) V Tr(q) . [Tr] 
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也 就 是 说 结论 对 所 有 情形 都 成 立 。 口 

证 明 使 用 了 v 对 ^ 的 分 配 律 ， 大 家 可 能 已 经 预计 到 了 这 点 。distrib 中 重 释 的 分 情丝 毫 也 没 
使 证 明 变 得 复杂 。 正 相反 ， 这 种 分 情 使 得 国 数 的 定义 更 简洁 ， 分 析 更 简单 。 
练习 6.23 ”对 于 类 型 prop 的 值 给 出 并 证 明 一 个 结构 归纳 规则 。 为 了 演示 这 个 规则 ， 对 pP 进 行 结 
构 归 纳 来 证 明 下 面 的 公式 : 

nnf p = nnfpos p \ nnf (Neg p) = nnfneg p 

BX 6.24 ”对 于 命题 定义 谓词 1snnf， 使 得 Isnnf (p) 当 且 仅 当 p 是 一 个 否定 范式 时 成 立 。 证 明 对 
于 所 有 命题 p?， 有 lsnnf (nnf p)。 
练习 6.25 令 T 为 命题 的 任 一 真 值 指派 。 证 明 对 于 所 有 命题 p?， 有 Tr(nnf p) Trp). 
6.8 良 基 归 纳 和 递归 

我 们 对 归纳 的 处 理 是 严格 的 ， 足 以 应 付 到 县 前 为 止 所 进行 的 非 形式 证 明 ， 但 是 还 不 够 形 
式 化 以 使 它 可 以 成 为 自动 的 。 很 多 归纳 原则 都 可 以 形式 地 仅 从 数学 归纳 法 导出 。 更 为 统一 的 


途径 是 采用 良 基 妇 纳 原则 ， 大 多 数 其 他 的 归纳 原则 都 是 它 的 特例 。 
良 基 关系 。 关 系 < 是 良 基 的 〈well-founded)， 如 果 不 存 在 无 穷 的 降序 链 
< 
例如 ， 自 然 数 上 的 “小 于 ”关系 是 良 基 的 。 整 数 上 的 “小 于 ”关系 却 不 是 良 基 的 : 存在 降序 链 
"<—n<...<—-2<-l 242 
有 理 数 上 的 “小 于 ”关系 也 不 是 良 基 的 ; 考虑 
1 1 1 
“<< 
可 以 看 到 ， 必 须 说明 关 系 的 定义 域 ， 也 就 是 在 它 之 上 定义 的 值 的 集合 ， 而 不 能 仅仅 说 < 是 良 
基 的 。 
另 一 个 良 基 关 系 是 自然 数 序 偶 的 字典 顺序 (lexicographic ordering)， 它 的 定义 如 下 
Cj) <e (D 当 且 仅 当 i<ivi@=inj <j) 
为 了 说 明 < 是 良 基 的 ， 先 假设 存在 一 个 无 穷 的 降序 链 
… <lex (ins Jn) <lex <lex (i2,J2) <lex (i, j1) 
WEG. 让 <i (i, 万 ， 那 么 i< i。 由 于 在 自然 数 上 的 < 是 良 基 的 ， 降 序 链 
L inL Sb Sh i 
ERME BART Mi: 也 就 是 说 对 于 所 有 n> M, Fi, =i. 现在 再 考虑 严格 的 降序 链 
-< jM+n < < jM+1 < JM 


这 个 必定 会 在 某 一 N 步 后 终止 在 某 个 常数 :上 : 也 就 是 说 对 于 所 有 n> M +N, Hlin j) = G, j) 
在 这 时 ， 序 偶 链 就 不 再 变化 了 ， 和 我 们 开始 假设 它 在 <a 关系 下 是 降序 的 相 巴 盾 。 
类 似 的 论证 可 以 说 明 关于 三 元 组 、 四 元 组 等 的 字典 顺序 都 是 良 基 的 。 自 然 数 表 上 的 字典 
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ee < [1,1,2] < < {1,2] < [2] 
另 一 类 和 良 基 关 系 是 由 所 谓 的 测度 函数 (measure function) 给 出 的 。 如 果 f 是 一 个 映射 到 自然 
数 的 函数 ， 那 么 存在 如 下 定义 的 良 基 关系 </ 


x<,y 当 且 仅 当 f(x)<f0) 
很 明显 ， 如 果真 的 存在 无 穷 的 降序 链 
和 
那么 ， 必 然 也 存在 无 穷 的 降序 链 
< < < fez) < f(x) 


在 自然 数 中 ， 这 是 不 可 能 的 。 这 里 了 通常 “测度 ”了 某 种 事物 的 大 小 。 良 基 关 系 <ouenen 和 Xsize 
根据 大 小 分 别 对 表 和 树 进行 比较 。 关 于 distrib 的 证 明 中 对 命题 序 偶 (p, 9) 使 用 了 测度 nodes(p) + 
nodes(q). 

在 上 面 关 于 < 是 良 基 关 系 的 说 明 中 ， 将 < 替换 成 别 的 良 基 关 系 也 同样 适用 。 例 如 , /可 以 
返回 使 用 < 比较 的 自然 数 序 偶 。 类 似 地 ， 关 于 < 关系 的 构造 方法 也 可 以 应 用 到 任何 已 有 的 
良 基 关 系 上 。 有 很 多 种 从 其 他 良 基 关 系 中 构造 新 良 基 关 系 的 办 法 。 通 常 ， 我 们 都 可 以 通过 构 
造 方 法 来 说 明 一 个 关系 是 良 基 的 ， 而 用 不 着 讨论 降序 链 。 

良 基 归纳 法 。 令 < 为 某 一 类 型 r 上 的 良 林 关系 ，Wx) 为 对 于 具有 类 型 t 的 所 有 x 待 证 明 的 性 
质 。 要 想 通过 良机 归纳 法 来 证 明 它 ， 只 要 对 于 所 有 ?证 明 下 面 的 归纳 步骤 : 

如 果 对 于 所 有 YY HOO), Woy) Iz. 
这 个 规则 可 以 写成 如 下 形式 : 


[Vy'<y.9(y')] 
p(y) 
G(x) 


这 条 规则 可 以 用 反 证 法 证 明成 立 : 如果 x) 对 于 菜 个 x 不 成 立 ， 那 么 我 们 就 可 以 取得 一 个 关 
于 < 的 无 穷 降序 链 。 根 据 归 纳 步骤 知 Vy'<x.9(y') 蕴涵 8(x)。 如 果 -9(X) ， 那 么 一 定 有 某 
个 六 <x 使 得 "gm) 。 对 yi 重复 这 个 讨论 ， 可 以 找到 某 个 yo < 六 使 得 ~ 从 7,)。 然 后 我 们 又 可 
以 得 到 y》 <y,。， 依 此 类 推 。S 

完全 归纳 法 是 这 个 规则 的 一 个 特例 ， 其 中 < 是 良 基 关 系 < (在 自然 数 上 的 )。 其 他 归纳 原 
则 都 是 良 基 归 纳 法 对 于 适当 选择 的 < 关系 的 特例 。 

自然 数 上 的 前 驱 关系 ，m<n7n 仅 当 m + 1 = n， 明 显 是 良 基 的 。 现 在 考虑 在 归纳 假 
设 Vy'<w y.9(y') 下 证 明 (y)。 存 在 两 种 情形 : 

。 如 果 y = 0， 那 么 <w 0 永远 不 会 成 立 ， 我 们 必须 直接 证 明 %(0) 成 立 。 


限制 条 件 : 不 能 出 现在 前 提 条 件 的 其 他 假设 中 。 


* 如果 y = k+l, IPA Y'n k+l AE = k 时 成 立 ， 所 以 我 们 可 以 在 证 明 Yk + 1) 时 假设 


O 无 穷 降序 链 在 直觉 上 容易 理解 ， 但 是 其 他 良 基 的 定义 使 得 证 明 更 简单 。 例 如 ， < 是 良 基 的 仅 当 每 一 个 非 空 
集合 都 有 一 个 < - 极 小 元 。 也 同样 存在 适合 构造 性 逻辑 的 定义 。 
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因此 ， 在 关系 <w 上 的 良 基 归 纳 法 恰好 就 是 数学 归纳 法 。 

结构 归纳 法 也 可 以 类 似 地 得 到 。 令 <i ARERR, WE XS <i 六 仅 当 对 于 某 个 x 有 x :: 
xs = ys。 直 观 地 说 ，xs < ys 表示 xs 是 ys 的 表 尾 。 在 良 基 关 系 ( 这 很 显然 <i 上 的 妇 纳 ， 产 生 
了 关于 表 的 结构 归纳 。 令 <r 为 树 上 的 关系 ， 使 得 "<r 上 仅 当 对 于 某 个 x 和 1" 有 Br(x, t', t") = ! 或 
Br(x, t,t) = 1。 在 这 个 “是 …… 的 子 树 ” 关 系 上 的 良 基 归 纳 产 生 了 关于 树 的 结构 归纳 。 

通过 测度 函数 给 出 的 良 基 关 系 产生 了 对 于 对 象 大 小 的 归纳 。 在 论证 distrib 的 时 候 ， 对 于 序 
偶 (p,q) 大 小 的 归纳 让 我 们 可 以 避免 进行 先 对 gq 然 后 对 p 的 催 套 结构 归纳 。 

良 基 归 纳 也 可 以 模拟 对 于 量词 约束 公式 的 归纳 ， 例 如 我 们 曾 通过 数学 归纳 法 证 明了 


Vp .facti(n, p) =n! x p 
其 实 只 要 对 于 序 偶 (n, p) 上 的 关系 < 使 用 良 基 归 纳 法 就 是 以 证 明 facti(n, p) = n!xp， 其 中 
(n', P') ja (n, p) 当 且 仅 当 n+l=n 


虽然 很 多 归纳 原则 都 可 以 完全 从 数学 归纳 法 中 导出 ， 但 是 推导 过 程 通常 涉及 到 量词 。 良 基 妇 
纳 法 使 得 在 没有 量词 的 逻辑 中 可 以 进行 有 意义 的 证 明 。 

良 基 递归 。 令 < 为 类 型 r 上 的 良 基 关 系 。 如 果 f 是 以 x (具有 类 型 rc) 为 形式 参数 的 函数 ， 
并 且 f 仅 当 y<x 时 才 进 行 递 妇 调用 f(y), 那么 f(x) 对 于 所 有 x 都 是 可 以 终止 的 。 在 这 种 情况 下 ， 
f 是 通过 在 < 上 的 良 基 递归 (well-founded recursion) 所 定义 的 。 

直观 地 说 ，/f (x) 能 够 终止 是 因为 < 没有 无 穷 的 降序 链 : 也 就 是 不 可 能 有 无 穷 的 递归 。 对 于 
良 基 递 归 的 正式 证 明 是 复杂 的 ; 除了 终止 问题 ， 它 还 必须 说 明了 (x) 的 定义 是 唯一 的 。 

对 于 我 们 的 大 多 数 递 归 函 数 来 说 ， 良 基 关 系 是 显然 的 。 如 果 n > 0， 那 么 faci(n) 递 归 调 
用 faci(n-1)， 所 以 fact 是 由 前 驱 关系 <w 上 的 良 基 递 归 所 定义 的 。 当 facti(n, p) 递 归 调 用 
facti(n-1, n xp) 时 ， 它 改变 了 第 二 个 参数 ， 良 基 关 系 是 <m 。 表 尔 数 niength、@ 和 nrev 都 是 
在 “是 …… 的 表 尾 ” 关 系 < 上 递归 的 。 

对 一 个 函数 是 可 终止 的 证 明 提示 了 关于 这 个 函数 的 一 个 有 用 的 归纳 形式 ， 请 回忆 我 们 关 
于 nnf 和 distrib 的 证 明 。 如 果 一 个 函数 是 由 < 上 的 良 基 递 妇 所 定义 ， 那 么 它 通常 可 以 用 < 上 的 
良 基 归 纳 来 证 明 。 


| 实践 中 的 良 基 关系 。 良 基 关 系 是 Boyer 和 Meoore (1988) 的 定理 证 明 机 的 核心 ， 
这 个 定理 证 明 机 也 叫做 NQTHM。 它 接受 由 良 基 递 归 定 义 的 函数 ， 并 使 用 精致 的 启发 
函数 来 选择 正确 的 关系 ， 以 用 于 良 基 归 纳 。 它 的 有 还 辑 是 没有 量词 的 ， 不 过 就 像 我 们 
所 看 到 的 ， 这 并 不 是 一 个 致命 的 限制 。NQTHM 是 现 有 的 一 个 最 重要 的 定理 证 明 机 。 
在 数学 和 计算 机 科学 的 许多 方面 所 需 的 证 明 都 曾经 用 它 来 完成 。 在 定理 证 明 机 
Isabelle 中 正式 开发 了 一 种 良 基 关 系 的 理论 (Paulson，1995， 第 3 节 )。 


6.9 递归 程序 模式 


良 基 关系 允许 对 程序 模式 的 论证 。 假 设 p 和 8 是 函数 ， 并 且 @ 是 中 缕 操 作 符 ， 考 虑 下 面 的 
ML 声明 l 
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fun f1 (x) = if p(x) then e else fl(g x) ® x; 
fun f2(x,y) = if p(x) then y else f2(g x, x ® y); 


假设 我 们 还 已 知 良 基 关 系 < ， 使 得 在 p(x) = falsely , 对 于 所 有 x 有 &8(x)<x 。 我 们 于 是 知道 户 
和 了 2 都 是 可 以 终止 的 ， 并 且 可 以 对 关于 它们 的 定理 作出 证 明 。 
定理 19 假设 四 是 中 级 操作 符 并 满足 结合 律 和 存在 单位 元 e; 也 就 是 对 于 所 有 xXx、y 和 z， 有 
xBYO2D=ABy) BZ 
epxrx=x=xe 
则 对 于 所 有 x， 我 们 有 2(x,e) = 了 1(x)。 
证 明 只 要 证 明 下 面 的 公式 ， 然 后 将 ?替换 成 e 即 可 : 
Vy .f2(x, y) = fl) ®y 


通过 < 上 的 良 基 归纳 可 以 证 明 它 成 立 。 存 在 两 种 情形 。 
如 果 p(x) = true, BA 


fzx, y) =y V2] 
=e@y [单位 元 ] 
= fl) @y [fl] 
如 果 p(x) = false, AA 
f2(x, y) = fLex, xy) if 2) 
=fl(gx) Bx@y [归纳 假设 ] 
=f10) @y fl] 
因为 8) <x ， 所 以 可 以 应 用 归纳 假设 。 这 里 隐 式 地 使 用 了 人 @ 的 可 结合 性 。 口 


由 此 可 见 ， 我 们 可 以 将 递归 函数 (f1) 利用 累加 器 转换 成 选 代 函 数 (f2 )。 这 个 定理 可 以 
应 用 于 计算 阶乘 。 令 
e=1 
=x 
g(x) =x-1 
p(x) = (x = 0) 
<= <N 
则 /是 阶乘 函数 ， 而 /2 就 是 facti。 这 个 定理 是 定理 4 的 推广 。 
我 们 对 程序 模式 所 采取 的 论证 方法 要 比 论 域 理论 来 得 简单 ， 但 普遍 性 要 差 些 。 在 论 域 理 
论 中 可 以 很 简单 地 证 明 任 何 形 如 
fun h x = if p x then x else h(h(g x)); 


的 ML 函数 都 满足 对 于 所 有 x 有 hh x) = h x， 而 不 论 函数 是 否 终止 。 我 们 的 办 法 不 能 轻易 地 处 
理 这 个 问题 ， 使 用 什么 良 基 关 系 来 说 明 h 中 岩 套 的 递归 调用 是 可 以 终止 的 呢 ? 
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练习 6.26 ”回顾 函数 大:， 使 得 对 于 所 有 x 和 ?有 fst, y) =x。 给 出 使 用 fst 作为 测度 函数 的 一 个 
良 基 关 系 的 例子 。 


练习 6.27 ASR Back: 
fun ack(0,n) 


| ack(m,0) 
| ack (m,n) 


n+1 
ack(m-1, 1) 
ack(m-1, ack({m,n-1)); 


利用 一 个 和 良 基 关系 来 说 明 ack(m, NITRA ARR MANA ELA. FR AAA 
ack(m,n)> m+n. 
练习 6.28 给 出 一 个 不 是 传递 的 良 基 关 系 的 例子 。 证 明 如 果 < 是 良 基 的 ， 那 么 它 的 传递 闭 
包 < 也 是 。 [247] 
练习 6.29 考虑 函数 half: 
fun half 0 = 0 
| half n = half (n-2); 
证 明 这 个 函数 是 由 良 基 递 归 所 定义 的 ， 记 住 说 明 良 基 关 系 的 定义 域 。 
练习 6.30 证 明 在 “是 …… 的 表 尾 ”关系 <* 上 的 良 基 归 纳 等 价 于 关于 表 的 结构 归纳 。 


.描述 和 验证 


排序 是 程序 验证 的 好 例子 : 它 简单 ， 却 又 琐碎 。 需 要 相当 的 工作 才能 描述 什么 是 排序 。 
我 们 之 前 的 大 多 数 正确 性 证 明 都 是 关于 两 个 函数 的 等 价 性 ， 篇 旺 很 少 超过 一 页 纸 。 而 证 明 函 
数 tmergesort 的 正确 性 却 需要 占 去 这 一 节 的 绝 大 部 分 ， 尽管 如 此 还 是 忽 赂 了 很 多 细节 。 

首先 ， 考虑 一 个 简单 一 点 的 描述 任务 : 最 大 公 因 子 。 如 果 m 和 nn 是 自然 数 ， 那 么 k 是 它们 的 
GCD 仅 当 k 可 以 同时 整除 m 和 n， 并 且 是 满足 这 个 条 件 的 最 大 的 数 。 已 知 这 个 描述 ， 就 不 难 验 
证 使 用 欧 几 里 得 算法 计算 GCD 的 ML 函数 了 : 


fun gcd(m,n) = 
if m=0 then n else gcd(n mod m, m); 


Re BREE RARE MT PS: | 
GCD(m, n) = max {kk 同时 整除 m 和 nn} 

GCD(m, n) 的 值 是 唯一 定义 的 ， 除 去 m = n = 0 情况 外 ， 这 时 最 大 值 不 存在 ; 我 们 不 需要 知道 
GCD(m, 门 是 否 可 计算 。 利 用 简单 的 数论 就 可 以 证 明 下 面 的 事实 : 

GCD(0,n) =n 当 n > 0 时 

GCD(m, n) = GCD(n mod m, m) “4m > 0 时 
而 通过 简单 的 归纳 可 以 证 明 对 于 所 有 不 都 为 0 的 自然 数 m 和 n， 有 gcdl(m, n) = GCD(m, n)。 从 中 
也 可 以 知道 GCD(m, nn) 是 可 计算 的 。 

排序 函数 则 不 能 如 此 验证 。 试 图 定义 一 个 数学 函数 sorting ， 然 后 证 明 tmergesort(xs) = 


sorting(xs) 的 做 法 并 不 实际 。 排 序 涉 及 了 两 个 不 同 的 正确 性 性 质 ， 我 们 可 以 分 别 孝 虚 : 
1. 输出 必须 是 一 个 有 序 表 。 248 
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2. 输出 必须 是 输入 元 素 的 某 个 重新 排列 。 
在 程序 验证 中 ， 某 些 正确 性 性 质 经 常 被 忽略 。 这 是 很 危险 的 。 函 数 可 以 返回 空 表 来 满足 性 质 1， 
或 将 输入 表 原 封 不 动 的 返回 来 满足 性 质 2。 单 独 的 某 个 性 质 是 没 用 的 。 

描述 并 不 一 定 需要 指定 输出 是 唯一 的 。 我 们 可 能 会 指定 编译 器 产生 正确 的 代码 ， 但 不 应 
该 指定 确切 要 生成 的 代码 。 这 会 使 得 描述 过 于 复杂 ， 而 且 妨 碍 了 代码 优化 。 我 们 可 以 指定 数 
据 库 系统 要 正确 地 响应 查询 ， 但 不 应 该 指定 确切 的 存储 格式 。 f 

在 下 面 的 几 节 中 将 要 证 明 tmergesorl 是 正确 的 ， 也 就 是 说 它 返 回 了 输入 元 素 的 有 序 排列 。 
让 我 们 回顾 几 个 来 自 第 3 章 的 函数 。 对 它们 可 以 终止 的 证 明 则 留 作 练习 。 

表 的 工具 函数 iake 和 drop: 

fun take ([], i) 

| take (x::xs, i) 


fun drop ([], -) 
| drop (x::xs, i) 


[] 
if i>0 then x: :take (xs, i-1) else (1; 


[] 


if i>0 then drop (xs, i-1) else x::xs; 


U t 


合并 函数 : 
fun merge((],ys) = ys : real list 
| merge (xs, []) = xs 


| merge (x: :xs, y: :ys) if x<=y then x: :merge (xs, y::ys) 


else y::merge(x::xs, ys); 
自 顶 向 下 的 合并 排序 : 


fun tmergesort [] 

| tmergesort [x] 

| tmergesort xs 
let val k = length xs div 2 

in merge (tmergesort (take(xs,k)), 

tmergesort (drop (xs,k))) 


end; 
6.10 有 序 谓词 
谓词 ordered 表 示 了 一 个 表 中 的 元 素 在 关系 < 下 是 升序 排列 的 。 它 的 性 质 如 下 : 
ordered({]) 
ordered((x]) 


ordered(x :: y :: ys) <> x < y A ordered(y :: ys) 
注意 ordered(x :: xs) T ordered(xs), RIEKIETWASHATARRATEA—-T AFR. 
定理 20 对 于 所 有 表 xs 和 73， 有 
ordered(xs) A ordered(ys) 一 ordered(merge(xs, ys)) 
证 明 对 miength xs + nlength ys 的 值 进行 归纳 。 


如 果 xs = [] 或 ys = []， 那 么 根据 merge 的 定义 就 得 到 了 结论 。 现 在 假设 对 于 某 个 xs' 和 ys'， 
有 xs =x:: xs' 且 ys =y :: ys'。 我 们 可 以 假设 





通 数 式 程 序 的 论证 191 


ordered (x :: xs') H. ordered(y :: ys') 
然后 必须 证 明 
ordered(merge(x :: xs‘, y :: ys')) 
考虑 x < y 的 情形 。( 关 于 x > y 的 情形 是 类 似 的 ， 留 作 练习 。) 根据 mersge 的 定义 ， 剩 下 要 证 明 
的 是 
ordered(x :: merge(xs', y :: ys')) 
我 们 已 经 知道 有 ordered(xs)， 可 以 应 用 归纳 假设 得 到 
ordered(merge(xs', y :: ys')) 
最 后 我 们 必须 证 明 x <u， 其 中 4 是 merge(xs', y: ys) 的 表 头 元 素 。 想 确定 表 头 元 素 则 需要 进 一 
步 的 情形 分 析 。 
如 果 xs' = 上 ,那么 merge(xs,y:: ys) =y u ys'。 则 它 的 表 头 元 素 是 y， 而 且 我 们 已 经 假设 
Tx<y. 
如 果 xs'=v: vs， 那 么 有 两 种 子 情形 : 
。 如 果 v <y， 那 么 merge(xs',y :: ys') = v :: merge(vs,y :: ysS')o 则 表 头 元 素 是 v， 因 为 xs =x: 
vii Vs， 所 以 根据 ordered(xs) 有 XxX < v. 
。 如 果 v > y， 那 么 merge(xs',y :: ys') = ys: merge(xs', ys”))。 则 表 头 元 素 是 y， 而 且 我 们 已 经 
假设 了 x<y。 口 
这 个 证 明 的 宛 长 很 令 人 惊 诈 。 也 许 merge 并 不 如 看 上 去 的 那么 直接 。 不 管 怎么 说 ， 我 们 现在 已 
经 做 好 了 准备 去 证 明 tmergesort 返 回 一 个 有 序 表 。 
定理 21 对 于 所 有 表 xs， 有 ordered(tmergesort xs), 
WEAR. 对 xs 的 长 度 进行 归纳 。 如 果 xs = [] 或 xs = [x]， 那 么 结论 是 显而易见 的 ， 所 以 现在 假设 
nlength xs > 2. 
4>k = (nlength xs) div 2。 则 有 1 <k< nlength xs。 很 容易 证 明 有 下 列 不 等 式 成 立 : 
nlength(take(xs, k)) = k < nlengthxs . 
nlength(drop(xs, k)) = nlengthxs — k < nlength xs 
根据 归纳 假设 ， 得 到 以 下 事实 : 
ordered(tmergesort(take(xs, k))) 
ordered(tmergesort(drop(xs, k))) 
由 于 merge 的 两 个 参数 都 是 有 序 的 ， 根 据 上 一 条 定理 就 得 出 了 我 们 要 的 结论 。 口 
练习 6.31 补充 本 节 证 明 中 的 细节 。 
练习 6.32 书写 另 一 个 谓词 来 定义 有 序 表 的 概念 ， 并 证 明 它 等 价 于 ordered。 


6.11 通过 多 重 集合 表示 重新 排列 


如 果 排 序 的 输出 是 输入 序列 的 一 个 重新 排列 ， 那 么 存在 一 个 函数 ， 称 作 排 列 
(permutation) ， 将 元 素 的 输入 位 置 映射 到 对 应 的 输出 位 置 。 为 了 证 明 排序 的 正确 性 ， 可 以 提 
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供 一 个 方法 来 展示 这 个 排列 。 然 而 ， 我 们 不 需要 这 么 多 的 信息 ， 这 会 增加 证 明 的 复杂 性 。 这 
样 的 描述 过 于 具体 了 。 

我 们 可 以 证 明 排序 的 输入 和 输出 包含 了 一 样 的 元 素 集合 ， 而 不 去 理会 每 个 元 素 被 移 到 什 
么 位 置 。 不 替 的 是 ， 这 个 方案 接受 [1,1,1,1.2] 作 为 [2.1.2] 的 有 效 排 序 。 集 合 是 不 区 分 重复 元 素 
的 。 这 种 描述 又 过 于 抽象 了 。 

多 重 集合 (multiset) 是 描述 排列 的 好 方法 。 多 征集 合 是 关心 元 素 个 数 而 不 是 元 素 顺序 的 
集合 。 多 重 集 合 <1, 1, 2> 和 <1, 2, 1> 是 一 样 的 ， 但 它们 不 同 于 <1, 2>。 多 重 集合 通常 称 为 色 
(bag)， 这 么 叫 的 原因 也 是 很 明显 的 。 下 面 是 一 些 构成 多 重 集合 的 方法 : 

，， 空 包 ， 不 包含 任何 元 素 。 

。<u>， 单 元 素 包 ， 只 包含 一 个 。 

© bWb,, ，b, 和 5b; 的 和 包 ， 包含 所 有 bl 和 b; 中 的 元 素 (累加 重复 的 元 素 )。 

我 们 不 把 包 看 作 是 基本 概念 ， 而 是 把 它们 作为 映射 到 自然 数 的 函数 。 如 果 b 是 一 个 包 ， 那 么 
b(n) 就 是 元 素 x 在 b 中 出 现 的 个 数 。 因 此 ， 对 于 所 有 x， 有 


G(x) = 0 
O Hu+x 
(u)(x) = t D 
(bi © b2)(x) = bi) + b2(x) 
下 面 的 定律 也 容易 验证 : 
by Y bz = b2 Y by 
(b1 W b2) W b3 = bi W (b2 © b3) 
ØwWb=b 
我 们 来 定义 将 表 转 换 成 包 的 函数 : 
bag[] = Ø 


bag(x :: xs) = (x) YH bag xs 
最 终 得 以 描述 “重新 排列 ”的 正确 性 性 质 : 
bag(tnergesort xs) = bag xs 
预备 性 证 明 。 为 了 说 明 关于 多 重 集合 的 论证 ， 让 我 们 看 一 个 证 明 。 这 只 是 个 常规 的 归纳 。9 
定理 22 对 于 所 有 表 xs 和 整数 k， 有 
bag(take(xs, k)) & bag(drop(xs, k)) = bag xs 
证 明 对 表 xs 进 行 结构 归纳 。 在 基本 情形 中 ， 
bag(take({], 有) 由 bag(drop( k)) - 
= bag[] © bag{] [take,drop] 


O ”如 果 我 们 采用 标准 库 的 take 和 drop 定 义 的 话 ， 这 个 证 明 就 不 那么 常规 了 。 标 准 库 中 的 take(xs, ka REDE 
常 ， 除非 0<k< length xs。 我 们 将 不 得 不 把 k 的 约束 写 在 定理 的 条 文 里 面 ， 并 据 此 对 证 明 作 修改 。 
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=ø0wWøð [bag] 
=ø [Wy] 
= bag{] [bag] [252 


对 于 归纳 步 又 ， 必 须 证 明 
bag(take(x :: xs, k)) ty bag(drop(x :: xs, k)) = bag(x :: xs) 
如 果 k >O, ABA 
bag(take(x :: xs, k)) W bag(drop(x :: xs, k)) 
= bag(x :: take(xs, k — 1))¥ 
bag(drop(xs, k — 1)) 
= (x) WY bag(take(as, k — 1)) © 


[take, drop] 


bag(drop(xs, k — 1)) [bag] 
= (x) YW bag xs [归纳 假设 ] 


= bag(x :: xs) [bag] 
如 果 k<0、 那 么 


bag(take(x :: xs, k)) ®© bag(drop(x :: xs, k)) 


= bag{] © bag(x :: xs) [take,drop] 
= OW bag(x :: xs) [bag] 
= bag(x :: xs) ` [由 ] 
因此 ， 对 于 所 有 整数 人 结论 都 成 立 。 . 口 


下 一 步 要 证 明 merge 将 其 参数 中 的 元 素 合 在 一 起 构成 了 结果 。 


定理 23 对 于 所 有 表 xs 和 ys， 有 bag(merge(xs, ys)) = bag xs wW bag ys. 
WERS ”对 niength xs + nlength ys 的 值 进行 归纳 。 


如 果 xs = [] 或 ys = [1， 那 么 立即 可 以 得 到 结论 ， 所 以 现在 假设 对 于 某 个 xs' 和 ys'， 有 
xs =x: X58 以 及 ys =y :: ys'。 我 们 必须 证 明 


bag(merge(x :: xs’, y :: ys’)) = bag(x :: xs’) W bag(y :: ys’) 
andix<y, MBA 


bag(merge(x :: xs’, y :: ys’) 
= bag(x :: merge(xs’, y :: ys’)) 


[merge] 
= (x) W bag(merge(xs’, y :: ys’)) [bag] 
= (x) W bag xs’ W bag(y :: ys’) [归纳 假设 ] 
= bag(x :: xs’) W bag(y :: ys’) [bag] 
x> ?的 情形 是 类 似 的 。 口 


最 后 ， 我 们 证 明 合 并 排序 保留 了 已 知 包 中 的 所 有 元 素 。 
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定理 24 对 于 所 有 表 xs， 有 bag(tmergesort xs) = bag xs, 
证 明 ”对 xs 的 长 度 进行 归纳 。 唯 一 困难 的 情形 是 当 nlength xs > 2 时 。 如 同 在 定理 21 中 一 样 ， 妇 
纳 假设 可 以 应 用 到 iake(xs, k) 和 drop(xs, k) E: 

bag(tmergesort(take(xs, k))) = bag(take(xs, k)) 

bag (tmergesort(drop(xs, k))) = bag(drop(xs, k)) 


因此 
bag(tmergesort xs) 
= bag(merge(tmergesort(take(xs, k)), 
tmergesort(drop(xs, k)))) [tmergesort] 
= bag(tmergesort(take(xs, k))) UY 
bag(tmergesort(drop(xs, k))) [定理 23] 
= bag(take(xs, k)) © bag(drop(xs, k)) [归纳 假设 ] 
= bag xs [定理 22] 
到 此 完成 了 imergesort 的 验证 。 口 


练习 6.33 ”请 验证 出 满足 交换 律 和 结合 律 。( 提示: 回忆 一 下 函数 的 外 延 相 等 。) 
练习 6.34 请 证 明 插 入 排序 保留 了 传 给 它 的 包 中 的 元 素 。 特 别 地 ， 证 明 下 列 等 式 : 
bag(ins(x, xs)) = (x) 出 bag xs 
bag(insort xs) = bag xs 


练习 6.35 ”请 修改 合并 排序 以 去 掉 重复 的 元 素 : 每 个 输入 的 元 素 应 只 在 输出 中 恰好 出 现 一 次 。 
形式 化 这 一 性 质 ， 并 指出 验证 它 所 需 的 定理 。 | 


6.12 验证 的 意义 


现在 可 以 宣布 tmergesort 得 到 了 验证 ， 但 是 这 就 意味 了 什么 吗 ? 我 们 到 底 为 tmergesorit 建 
立 了 什么 ? 形式 验证 有 三 个 基本 的 局 限 : 

1. 计算 模型 可 能 太 不 严密 了 。 通 常 硬 件 都 是 被 假设 为 绝对 可 靠 的 。 能 够 处 理 诸如 算术 滋 
出 、 舍 入 误差 或 空间 不 足 等 特定 错误 的 模型 也 是 可 以 设计 出 来 的 。 然 而 ， 计 算 机 可 能 以 出 乎 
意料 的 方式 发 生 错误 。 如 果 有 人 砍 它 一 甜头 将 会 怎么 样 ? 

2. 描述 可 能 是 不 完备 的 或 是 错误 的 。 设 计 的 需求 很 难 形式 化 ， 特 别 是 当 它 们 反映 实际 应 
用 的 时 候 。 满 足 一 个 错误 的 描述 并 不 能 满足 客户 。 软 件 工程 师 们 都 懂得 验证 (verification) 
(我 们 是 否 正确 地 制造 了 产品 ? ) MANAR (validation) (我 们 是 否 制造 了 正确 的 产品 ? ) 
之 间 的 区 别 。 

3. 证 明 也 可 能 含有 错误 。 自动 定理 证 明 能 够 减少 但 不 能 消除 出 现 错误 的 可 能 性 所 有 人 
为 的 东西 都 可 能 有 缺陷 ， 甚 至 是 我 们 的 数学 原理 。 这 不 仅仅 是 个 哲学 问题 。 很 多 错误 被 发 现 
于 定理 证 明 机 、 证 明 规 则 以 及 公开 出 版 的 证 明 中 。 
除了 这 些 基 本 的 局 限 外 ， 还 有 一 个 实际 的 局 限 : 形式 证 明 是 兄长 而 乏味 的 。 回 顾 本 章 的 证 明 ， 
它们 大 多 是 很 费力 地 在 证 明 非 常 基本 的 东西 。 现 在 想像 一 下 去 验证 一 个 编译 程序 。 这 个 描述 
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将 是 巨型 的 ， 包 含 了 程序 设计 语言 的 语法 和 语义 ， 以 及 目标 机 器 完整 的 指令 集 。 这 个 编译 器 
将 是 个 很 大 的 程序 。 对 它 的 证 明 必 须 分 成 几 部 分 ， 分 别 验证 词法 分 析 器 、 类 型 检测 程序 、 中 
间 代 码 生 成 器 等 。 有 可 能 时 间 只 允许 验证 最 值得 注意 的 部 分 : 比如 说 代码 生成 器 ， 所 以 被 
“验证 ”过 的 编译 器 有 可 能 因为 错误 的 词法 分 析 而 失败 。 

我 们 也 不 要 过 于 悲观 。 书 写 形式 描述 可 以 揭示 出 设计 需求 中 的 歧义 和 不 一 致 的 地 方 。 由 
于 设计 错误 要 比 编码 错误 的 影响 大 得 多 ， 因 此 ， 即 便 不 验证 代码 ， 书 写 描述 也 是 很 有 价值 的 。 
很 多 公司 花费 巨大 的 代价 去 生成 即使 不 是 完全 形式 化 的 也 是 很 严格 的 描述 。 

艰苦 的 验证 工作 也 会 带 来 收获 。 大 多 数 程序 都 是 不 正确 的 ， 这 时 尝试 去 证 明 它 通常 可 以 
查 明 错 误 所 在 。 想 体会 这 个 ， 可 以 在 本 章 验证 的 任何 一 个 程序 里 面 播 入 错误 ， 然 后 再 走 一 遍 
证 明 。 证 明 将 会 失败 ， 同 时 失败 的 地 方 会 精确 地 指出 在 什么 情况 下 修改 后 的 程序 会 出 错 。 

正确 性 证 明 是 关于 程序 或 系统 如 何 运作 的 一 个 详细 解释 。 如 果 证 明 很 简单 ， 我 们 可 以 逐 
行 地 分 析 ， 把 它 看 作 是 程序 执行 的 一 系列 快照 。 比 如 ， 归 纳 步 又 跟 踪 了 在 递归 调用 时 所 发 生 
的 事情 。 大 型 证 明 可 能 由 几 百 条 定理 组 成 ， 这 些 定理 考察 了 所 有 的 组 件 和 子 系统 。 

描述 和 验证 产生 了 对 程序 及 其 任务 更 完整 的 认识 。 这 使 得 对 系统 的 信心 更 强 。 形 式 证 明 
不 能 免 去 对 系统 测试 的 需要 ， 特 别 是 对 于 安全 至 关 重 要 的 系统 。 测 试 是 唯一 的 办 法 来 考察 计 
算 模型 和 形式 描述 是 否 准 确 地 反映 了 真实 情况 。 然 而 ， 虽然 测试 可 以 检测 错误 ， 但 是 它 不 能 
保证 成 功 ; 它 也 不 能 让 我 们 洞悉 程序 是 怎样 工作 的 。 


(©) 进一步 的 阅读 。Bevier 等 (1989) 验证 了 一 个 由 多 个 层次 组 成 的 微型 计算 机 系 
统 ， 包 括 软件 和 硬件 。Avra Cohn (1989a) 验证 了 Viper 微 处 理 器 的 一 些 正确 性 性 质 。 
以 她 的 证 明 作 为 例子 ，Cohn (1989b) 讨论 了 验证 的 基本 局 限 。 

Fitzgerald 等 (1995) 报告 了 一 项 研究 ， 其 中 两 个 小 组 互相 独立 地 开发 了 一 个 信 
任 网 关 。 控 制 小 组 使 用 了 传统 的 方法 ， 而 实验 小 组 在 这 些 方法 外 增加 了 书写 形式 描 
述 。 关 于 流水 线 微 处 理 器 AAMP5 有 特别 大 量 的 研究 ， 这 是 一 款 为 航空 电子 设备 而 设 
计 的 商业 产品 。 它 被 分 为 两 个 层次 进行 描述 ， 并 且 证 明了 它 的 一 些微 指令 是 正确 的 
(Srivas 和 Miller，1995)。 这 两 个 研究 都 显示 了 书写 形式 描述 ， 不 论 是 否 伴随 着 形式 
证 明 ， 都 是 可 以 发 现 错误 的 。 

Susan Gerhart 等 (1994) 进行 的 一 项 主要 研究 考察 了 12 个 涉及 使 用 形式 方法 的 
案例 。 在 一 个 著名 的 哲学 专 论 中 ，Lakatos (1976) 称 ， 我 们 可 以 从 部 分 的 甚至 是 错 
误 的 证 明 中 学 到 知识 。 


要 点 小 结 


“很 多 函数 式 程序 都 可 以 在 初等 数学 的 范畴 内 给 予 一 个 含义 。 高 阶 函 数 也 是 可 以 处 理 的 ， 
但 是 情 性 求 值 或 无 穷 数 据 结构 却 超出 了 这 个 范畴 。 

* 对 于 函数 可 终止 的 证 明 具有 和 大 多 数 其 他 函数 证 明 一 样 的 通用 形式 。 

* 数学 归纳 法 适用 于 涉及 自然 数 的 递归 函数 。 

。 结构 归纳 法 适用 于 涉及 表 和 树 的 递归 函数 。 

。 良 基 归 纳 和 递归 可 以 处 理 广泛 的 可 终止 计算 问题 。 

© 程序 证 明 需 要 精确 和 简单 的 描述 。 

* 证 明 可 能 会 出 错 ， 但 是 通常 传递 了 有 价值 的 信息 。 
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第 7 章 抽象 类 型 和 函 子 


大 的 程序 应 该 组 织 成 有 层次 的 模块 ， 这 一 点 ， 每 个 人 都 认可 。Standard ML 的 结构 和 签名 
符合 这 个 要 求 。 结 构 可 以 将 相关 的 类 型 、 值 和 函数 声明 包装 在 一 起 。 签 名 可 以 指定 一 个 结构 
所 必须 包含 的 组 件 。 从 第 2 章 的 复数 到 第 $ 章 的 无 穷 序列 ， 我 们 已 经 利用 结构 和 签名 的 最 简 形 
式 对 这 样 的 一 系列 例子 进行 了 处 理 。 

模块 化 的 结构 使 得 程序 容易 理解 。 更 为 有 用 的 是 ， 模 块 应 该 作为 可 以 互相 替换 的 组 件 : 
将 一 个 模块 换 成 它 的 改良 版 本 不 应 该 影响 程序 的 其 他 部 分 。Standard ML 的 抽象 类 型 (abstract 
type) 和 函 子 (functor) 可 以 帮助 实现 这 个 目标 。 

模块 可 能 会 暴露 它 的 内 部 细节 。 当 模块 被 替换 时 ， 程 序 中 依赖 这 些 细节 的 其 他 部 分 就 会 
失败 。ML 提 供 了 几 种 方法 ， 在 声明 抽象 类 型 和 相关 操作 的 同时 ， 隐 藏 类 型 的 具体 表示 。 

如 果 结 构 B 依 赖 结 构 A， 并 且 我 们 希望 把 4 替换 成 另 一 个 结构 4'， 那 么 可 以 编辑 程序 文本 并 
重新 编译 程序 。 当 4 完全 过 时 并 可 以 放弃 时 ， 这 样 做 是 可 以 满足 要 求 的。 然而 ， 如 果 4 和 4A4' 都 
有 用 怎么 办 ? 比如 说 像 表达 不 同 精度 浮 点 运算 这 样 的 结构 。 

ML 多 许 将 8 声明 成 用 结构 作为 参数 的 结构 。 然 后 就 可 以 使 用 B(4) 和 B(4) 了 ， 也 可 能 是 同 
时 使 用 。 像 这样 参数 化 的 结构 叫做 函 子 。 国 子 允 许 将 4 和 4' 看 作 是 可 以 互 换 的 部 分 。 

模块 的 语言 部 分 与 类 型 和 表达 式 的 核心 语言 部 分 是 截然 不 同 的 。 它 关心 的 是 程序 的 组 织 ， 
而 不 是 计算 本 身 。 模 块 可 以 包含 类 型 和 表达 式 , 但 反 过 来 却 不 行 。 主 要 的 模块 构造 在 核心 语 
言 中 存在 可 以 类 比 的 部 分 : 

结构 ~ 值 
签名 ~ 类 型 
国 子 ~ 国 数 
这 个 类 比 可 以 作为 理解 的 起 点 ， 但 是 它 并 不 能 传达 ML 模块 系统 的 全 部 能 力 。 


本 章 提要 


本 章 将 更 深入 地 对 结构 和 签名 进行 讨论 ， 并 介绍 抽象 类 型 和 函 子 。 很 多 模块 语言 里 的 特 
性 主要 都 是 为 支持 函 子 而 准备 的 。 本 章 包括 以 下 几 节 : 

。 队 列 的 三 种 表示 方法 。 三 个 不 同 的 结构 实现 了 队列 ， 说 明了 多 种 数据 表示 方法 的 思想 。 
但 是 结构 并 不 能 隐藏 队列 的 表示 ， 它 可 能 被 程序 的 其 他 地 方 误 用 。 

“签名 和 抽象 。 队 列 结构 的 签名 约束 可 以 隐藏 细节 ， 它 声明 了 一 个 队列 的 抽象 类 型 。 
abstype 声 明 可 以 更 为 灵活 地 声明 抽象 类 型 。 三 个 队列 的 表示 法 都 有 它们 各 自 的 具体 
签名 。 

*。 浮子 。 印 子 可 以 把 三 种 队列 实现 作为 可 互 换 的 部 分 ， 首 先 用 在 测试 框架 中 ， 然 后 用 于 广 
度 优先 搜索 。 另 外 一 个 例子 是 泛 型 矩阵 运算 ， 应 用 在 数值 和 图 论 中 。 函 子 允 许 对 于 任意 
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有 序 类 型 汉化 地 表达 字典 和 优先 队列 。 i 
。 使 用 模块 构造 大 型 系统 。 这 里 讨论 了 一 系列 深入 的 问题 : 函 子 的 多 个 参数 、 共 享 约 束 以 
及 完全 函 子 化 的 程序 设计 方式 。 新 的 声明 形式 ， 例 如 open 和 include， 可 以 帮助 管理 
大 型 程序 中 纵深 的 层次 结构 。 

。 模 块 参考 指南 。 系 统 简 明 地 表述 了 完整 的 模块 语言 。 


队列 的 三 种 表示 方法 


队列 (queue) 是 这 样 一 种 序列 ， 它 的 元 素 只 能 从 末端 妃 加 ， 并 且 只 能 从 首 端 取出 。 队 列 
执行 的 是 先进 先 出 (FIFO, first-in-first-out) 原则 。 队 列 提供 以 下 的 操作 : 
. empty: 空 队列 。 
e engla, x): 通过 将 x 加 到 4 的 末端 所 得 到 的 队列 。 
enull(q): 测试 4 是 否 为 空 所 返回 的 布尔 值 。 
ehd(q): 4 的 首 元 素 。 
o dealg): 通过 将 4 的 首 元 素 删除 所 得 到 的 队列 。 
258 sE: 在 队列 为 空 时 由 hd 和 deq 所 抛 出 的 异常 。 
队列 的 操作 是 函数 式 的 : eng 和 deg 创 建新 的 队列 ， 而 不 是 修改 原 有 的 队列 。 我 们 将 讨论 几 种 
表示 队列 的 方法 ， 并 将 它们 定义 为 ML 的 结构 ， 最 后 找 出 一 种 高 效 的 表示 方法 。 
名 字 enqg 和 deg 是 单词 进 队 列 (enqueue) 和 出 队列 (dequeue) 的 简写 ， 而 null 和 hd 则 和 现 
有 的 表 操 作 名 字 发 生 冲 突 。 由 于 我 们 将 操作 包装 在 结构 中 ， 因 此 可 以 不 用 顾忌 冲突 地 使 用 短 
名 字 。 . 
书写 相应 的 签名 是 很 简单 的 ， 不 过 让 我 们 先 把 这 个 推迟 到 下 一 节 。 那 时 我 们 还 将 考虑 怎 
样 通过 声明 抽象 类 型 来 隐藏 表示 方法 。 


7.1 将 队列 表示 为 表 
也 许 是 最 明显 的 ， 表 示 法 1 将 队列 维持 在 由 其 元 素 组 成 的 表 中 。 结 构 Queuel 声 明 如 下 : 


structure Queuel = 
struct 
type ‘a t = ‘a list; 
exception E; 


val empty = [}; 
fun enq(q,x) =q @ [x]; 


fun null(x::q) = false 
| null _ = true; 


fun Ad(x::q) = x 


| hd [{] raise E; 
fun deq(x::q) = q 

| deq [} = raise E; 
end; 


队列 的 类 型 就 是 a t; 在 结构 之 外 是 a Queuel.t. a Queuel .t 是 类 型 缩写 ， 这 使 得 它 成 为 a list 
的 同义词 。( 可 以 回顾 2.7 节 中 我 们 将 vec 作 为 real x real 的 同义词 ) 由 于 类 型 a Queuel .i 的 值 
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可 以 用 于 任何 的 表 操作 ， 这 个 类 型 的 名 称 除了 作为 注释 以 外 几乎 没什么 用 处 。 


函数 eg 使 用 了 追加 操作 ， 而 de4 则 是 利用 了 模式 匹配 。 其 他 的 队列 操作 都 实现 很 简单 、 


很 高 效 。 不 过 eng(q, x) 却 需要 和 gq 的 长 度 成 正比 的 时 间 : 很 不 令 人 满意 。 


结构 并 不 能 隐藏 信息 。 除 了 将 结构 声明 作为 一 个 整体 并 引入 了 复合 名 字 外 ， 声 明 一 个 结 
每 个 项 目的 作用 都 和 单独 声明 时 一 样 。 结 构 


构 和 单独 声明 里 面 的 项 目 几 乎 没什么 区 别 。 
Queuel 没 有 将 队列 和 表 区 分 开 来 : 


Queuel .deq ["We", "happy","few"!]; 
> ["happy", "few"] : string list 


7.2 将 队列 表示 为 新 的 数据 类 型 


表示 法 2 声明 了 一 个 数据 类 型 ， 它 带 有 构造 子 empty 和 enqg。 现 在 操作 engq(4, x) 只 需要 常数 


时 间 ， 和 4 的 长 度 无 关 , 但 是 hd(q) 和 deq(q) 却 很 惕 。 调 用 deq(q) 需 要 将 q 的 剩余 元 素 都 复制 


元 素 |— iki . 
其 至 连 hd(q) 也 需要 递归 调用 。. 


structure Queue2 = 
struct 


datatype ’a t = empty 
| eng of 'a t * ‘a; 
exception E; 
fun null (eng _) = false 
| null empty = true; 


fun hd (engq(empty,x)) = x 


| hd (enq(q,x)) = hd q 

| hd empty = raise E; 
fun deq (enq(empty,x)) = empty 

| deq (enq(q,x)) = eng(deq q, x) 

| deq empty = raise E; 


end; 


通过 定义 新 的 数据 类 型 ， 表 示 法 2 并 没什么 变化 。 它 基本 上 和 将 队列 表示 成 一 个 逆向 表 没 什么 
不 同 。 那 样 的 话 : 
eng(qg, XxX)=x::q 
而 deq 则 是 一 个 移 走 表 尾 最 末 元 素 的 递归 函数 。 我 们 可 以 称 之 为 表示 法 2a。 
队列 类 型 a Queue2 .i 并 不 是 抽象 的 ， 它 是 带 有 构造 子 Queue2 .empty 和 Queue2 .engq 的 数据 
类 型 。 利 用 构造 子 进行 模式 匹配 可 以 将 队列 的 最 后 一 个 元 素 移 出 ， 这 破坏 了 它 的 FIFO 原 则 : 


fun last (Queue2.enq(q,x)) = x; 


> val last = fn : ‘a Queue2.t -> ‘a 


这 个 声明 误 用 了 该 数据 结构 。 如 果 在 程序 中 这 样 的 误 用 遍布 各 处 的 话 ， 那儿 乎 不 可 能 对 队列 
的 表示 作出 改变 ， 程 序 将 很 难 维护 。 


同样 ， 结 构 没 有 隐藏 信 息 。Queuel1 和 Queue2 之 间 的 区 别 从 外 部 是 可 见 的 。 函 数 Quenel .null 
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可 以 应 用 在 任何 的 表 上 ，、 而 Queue2 .null 只 能 应 用 在 类 型 为 a Queue2.t 的 值 上 。Queuel .enq 和 和 [260 


Queue2 .eng 都 是 函数 ， 不 过 Queue2 .eng 还 是 一 个 构造 子 ， 可 以 出 现在 模式 中 。 
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这 个 数据 类 型 声明 违反 了 构造 子 名 字 以 大 写字 母 为 首 的 约定 〈4.4 节 )。 在 小 型 结构 的 范围 
中 这 不 算 什 么 ， 不 过 输出 这 样 的 构造 子 就 有 问题 了 。 


7.3 将 队列 表示 为 表 的 序 偶 
表示 法 3 (Burton，1982) 将 队列 维护 在 一 对 表 里 面 。 序 偶 
(Exi, %2,--- s Xm], D 7 ,yn]) 
表示 队列 
XIX2 Mtym °° Y2Yt 


这 个 队列 包括 一 个 前 部 和 一 个 后 部 。 后 部 的 元 素 是 逆序 存储 的 ， 这 样 新 元 素 可 以 很 迅速 地 加 
ZNE, engla, y) 修 改 队列 使 得 : 


(xs, D1,...， Yn) > Gs, Ly Yis.. + yal) 
前 部 的 元 素 则 以 正确 的 顺序 存储 ， 这 样 它们 可 以 被 迅速 地 从 队列 中 移出 ，deq(q) 修 改 队列 
使 得 : 

([X1, %2,--- s Xml, ys) > ([x2,... , Xml, ys) 
当前 部 变 为 空 时 ， 就 将 后 部 翻转 并 移 至 前 部 : 

E, Di + ¥nl) > (Dn ,72, 91), ID 

然后 ， 后 部 又 可 以 进一步 积累 元 素 直 到 前 部 再 次 变 为 空 。 如 果 当 上 > 1 时 ， 队 列 不 具有 下 面 的 
形式 


(D, D1, y2,... , yn]) 
则 称 这 个 队列 为 标准 形式 (normal form) 的 队列 。 队 列 的 操作 保证 了 它们 的 结果 具有 标准 形 
式 。 因 此 ， 检 查 队列 的 首 元 素 并 不 会 引起 翻转 。 标 准 队列 当 它 的 首部 为 空 时 为 空 。 
下 面 是 这 个 方案 的 结构 。 队 列 类 型 被 声明 为 带 有 一 个 构造 子 的 数据 类 型 ， 而 不 是 类 型 缩 
写 。 我 们 对 于 弹性 数组 曾 使 用 了 类 似 的 技术 ( 见 图 4-3)。 这 种 构造 子 在 运行 时 没有 开销 ， 却 
能 使 代码 中 的 队列 和 其 他 类 型 的 值 区 分 开 来 。 


structure Queue3 = 
struct 
datatype ‘a t = Queue of ('a list * ‘a list); 
exception E; 


val empty = Queue(({},[]); 


fun norm (Queue([(],tails)) = Queue (rev tails, []) 
| norm q = qi 


fun eng (Queue (heads, tails), x) = norm(Queue (heads, x: :tails)); 


“fun null (Queue({],[]1)) = true 

| null _ = false; 
fun hd(Queue(x::_,_)) =x 

| hd(Queue({],_)) = raise E; 
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fun deq (Queue (x: : heads, tails) ) 


norm ( Queue (heads , tails) ) 
raise E; 


deq (Queue ([1,_)) 


end; 


图 数 aorm 在 需要 时 通过 翻转 后 部 将 队列 变 为 标准 形式 。 它 会 被 eng 和 deq 调 用 ， 这 是 因为 队列 
在 每 次 加 入 和 删除 元 素 后 都 必须 成 为 标准 形式 。 


同样 ， 


内 部 细节 没有 被 隐藏 起 来 。 使 用 者 仍 可 以 通过 构造 子 Queue3 .Queue 和 函数 


Queue3 .norm 进 行 算 改 。 通 过 构造 子 Queue 进 行 模式 匹配 可 以 暴露 出 队列 是 由 一 对 表 组 成 的 。 
在 结构 内 部 ， 这 种 访问 必 不 可 少 ; 但 用 在 外 部 ， 它 就 可 能 破坏 队列 的 FIFO 原 则 。 在 外 部 调用 
Cuere3.norm 则 达 不 到 什么 目的 。 


O 这 个 表示 法 的 效率 如 何 ? 使 用 翻转 操作 看 起 来 代价 很 高 。 但 是 从 队列 的 整个 使 
用 周期 平均 来 看 ，eng 和 deg 操 作 的 开销 是 常量 。 每 个 队列 元 素 最 多 有 两 个 表 构 造 (::) 


操作 ， 


一 个 是 在 它 被 追加 至 队列 后 部 时 ， 另 一 个 是 在 第 被 移 至 队列 前 部 时 。 


在 数据 结构 的 整个 使 用 周期 上 衡量 开销 的 做 法 叫做 分 挫 (amortized) 开销 
(Cormen 等 ，1990)。Sleator 和 Tarjan (1985) 展示 了 另 一 种 数据 结构 : 自 调节 树 ， 
它 具 有 很 好 的 分 挫 开 销 。 这 种 数据 结构 的 主要 缺点 是 开销 的 分 配 并 不 均匀 。 当 进行 
标准 化 操作 时 ， 翻 转 可 能 引起 意外 的 廷 时。 

另外 ， 分 摊 开 销 的 计算 是 基于 假定 队列 的 使 用 是 按 命 令 式 的 方式 进行 的 : 是 单 
线 的 (single-threaded )。 每 次 数据 结构 被 更 新 后 ， 原 先 的 值 应 该 丢弃 。 如 果 我 们 破 
坏 这 一 假定 ， 比 如 不 断 地 将 deq 应 用 到 形 如 


([x], by, Y2, nee Yn) 


的 队列 上 ， 那 么 就 会 发 生 额 外 的 标准 化 操作 ， 带 来 更 大 的 开销 。 

弹性 数组 可 以 表示 队列 ， 并 避免 上 述 的 缺点 。 但 是 每 个 操作 的 代价 会 增加 到 和 
log 7 成 正比 ， 其 中 是 队列 的 元 素数 目 。 表 示 法 3 简单 而 有 将， 值得 推荐 给 大 多 数 需 
要 函数 式 队列 的 场合 。 


练习 7.1 在 表示 法 1 下 ,通过 从 空 队 列 开始 应 用 eng 操 作 ， 需 要 多 少时 间 才 能 建立 起 一 个 n- 元 
素 的 队列 ? 

练习 7.2 讨论 三 种 表示 法 的 相对 价值 。 例 如 ， 是 否 存 在 某 种 情况 使 得 表示 法 1 可 能 比 表示 法 3 
更 高 效 。 

练习 7.3 用 ML 编写 表示 法 2a。 

练习 7.4 表示 法 4 使 用 弹性 数组 ， 用 hiext 实 现 eng， 用 lorem 实 现 deq。 编 写 表 示 法 4， 并 和 表 
示 法 3 比较 效率 。 

练习 7.5 ”传统 上 队列 使 用 数组 来 表示 ， 用 索引 指向 第 一 个 和 最 后 一 个 元 素 。 第 4 章 的 函数 式 


数组 适合 这 个 目的 吗 ? 它 和 其 他 函数 式 队 列 相 比 怎样 ? 


签名 和 抽象 


抽象 类 型 (abstract type) 是 具有 一 套 操作 的 类 型 ， 也 只 有 这 些 操作 可 以 应 用 在 这 个 类 型 
上 。 类 型 的 表示 可 以 改变 ， 也 许 能 变 得 更 为 有 效 ， 但 不 会 影响 程序 的 其 他 部 分 。 抽 象 类 型 使 
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得 程序 更 容易 理解 和 修改 。 队 列 就 应 该 定义 为 抽象 类 型 ， 将 内 部 细节 隐藏 起 来 。 
我 们 可 以 通过 约束 结构 签名 来 限制 外 部 对 其 组 件 的 访问 。 还 可 以 通过 abstype 声 明 来 隐 
藏 类 型 的 表示 方法 。 组 合 运 用 这 些 方法 就 产生 了 抽象 结构 。 


7.4 队列 应 具有 的 签名 


虽然 结构 Queuel1、Queue2 和 Queue3 彼 此 不 同 ， 但 是 它们 都 实现 了 队列 。 此 外 ， 它 们 还 共 
享 了 一 致 的 接口 ， 这 个 接口 由 签名 QUEUE 给 出 : 


signature QUEUE = 


sig 

type ‘at (* 队列 的 类 型 *) 
exception E (* 在 ha，deg 中 产生 的 错误 *) 
val empty: ‘at (* 空 队 列 *) 

val eng : 'a t *'a ->’at (* 加 到 队 尾 *) 

val null : 'a t -> bool (* 测试 空 队 列 *) 

val hd : ‘at -> 'a (* 返回 首 元 素 *) 

val deq : ‘at->'at (* 删除 首 元 素 *) 

end; - 


签名 中 的 每 一 条 叫做 一 个 描述 。 每 个 描述 后 面 的 注释 是 可 选 的 ， 但 可 以 使 签名 传递 更 多 的 信 
息 。 若 想 让 一 个 结构 可 以 成 为 这 个 签名 的 实例 (instance )， 那 么 它 至 少 要 定义 以 下 几 项 ， 

。 一 个 多 态 类 型 at ( 它 并 不 需要 允许 相等 测试 ) 

。 一 个 异常 E 

。 一 个 类 型 为 a tt {empty 

。 一 个 类 型 为 at x a> a t 的 值 engq 

。 一 个 类 型 为 a 1 一 bool 的 值 null 

。 一 个 类 型 为 a1- a 的 值 hd 

。 一 个 类 型 为 a t> at 的 值 deq 
我 们 依次 看 看 每 一 个 结构 。 在 Queuel 中 ， 类 型 a the list 的 缩写 ， 并 且 结 构 中 的 值 在 这 个 缩写 
下 都 具有 正确 的 类 型 。 在 Queue2 中 ， 类 型 a t 是 一 个 数据 类 型 ， 并 且 empty 和 engq 都 是 构造 子 。 
在 Queue3 中 ， 同 样 a 1 是 一 个 数据 类 型 ， 结 构 还 定义 了 签名 QUEUE 所 要 求 的 所 有 的 值 ， 以 及 
额外 的 项 目 : Queue 和 norm。 签 名 的 实例 可 以 包含 签名 中 没有 描述 到 的 项 目 。 


75 签名 约束 


结构 的 具有 不 同 抽象 程度 的 多 个 视图 ， 可 以 通过 使 用 不 同 的 签名 得 到 。 结 构 可 以 在 首次 
定义 的 时 候 被 约束 到 签名 上 ， 也 可 以 在 稍 后 进行 。 约 束 既 可 以 是 透明 的 也 可 以 是 不 透明 的 。 

迁 明 签名 约束 。 我 们 到 目前 为 止 所 使 用 的 约束 ， 都 是 由 冒号 (:) 表示 的 ， 是 透明 的 。 要 
明白 这 意味 着 什么 ， 让 我 们 用 签名 QUEUE 来 约束 现 有 的 结构 : 


structure Si: QUEUE = Queuel; 
structure $2: QUEUE = Queue2; 
structure $3: QUEUE = Queue}; 


这 些 声 明 使 得 8S1、52 和 $3 相应 地 表示 了 与 Queuel1、Queue2 和 Queue3 同 样 的 结构 。 然 而 ， 新 的 
结构 是 由 签名 QUEUE 来 约束 的 。 类 型 a Queue2.t 和 a 52.t 是 一 样 的 ， 但 是 Queue2 .empiy 是 一 
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个 构造 子 ， 而 $2 .empty 只 能 被 用 作 一 个 值 。 结 构 Cuexe3 和 583 是 相等 的 ， 但 是 Oueve3 .norm 是 
一 个 函数 ， 而 $3 .norm 则 什么 也 不 是 。 

透明 的 签名 约束 可 以 隐藏 组 件 ， 但 是 它们 还 是 存在 的 ， 这 不 能 被 称 作 抽象 。 结 构 51 根 本 
就 没有 隐藏 它 的 表示 ; 类 型 a S1.! 仍 旧 相 当 于 a list. 

Sl.deq ["We","band","of","brothers" j; 

> ["band", "of", "brothers"] : string Sl.t 
结构 S$2 和 53 看 上 去 可 能 更 抽象 些 ， 因 为 它们 声明 了 数据 类 型 a :+， 同 时 隐藏 了 它们 的 构造 子 。 
没有 构造 子 就 不 能 利用 模式 匹配 来 将 类 型 的 值 拆散 以 暴露 表示 方法 。 然 而 ， 构 造 子 
Queue3 .Queue 却 可 以 用 在 模式 中 来 拆散 类 型 a 53 .i 的 值 : 

val Queue3. Queue (heads, tails) = 

S3 . eng (S3 .enq (S3 .empty, "Saint"), "Crispin"); 

> val heads = ["Saint"] : string list 

> val tails = ["Crispin"] : string list 
具体 的 结构 Queune3， 为 它 的 抽象 视图 $S3， 提 供 了 一 个 漏洞 。 

数据 抽象 在 另 一 个 方面 也 被 危及 。 对 于 我 们 的 每 个 队列 结构 来 说 ， 类 型 a 1 都 是 允许 相等 
测试 的 。 相 等 测试 比较 的 是 内 部 表示 ， 并 不 是 队列 。 在 表示 法 3 下 ， 人 和 值 ([1,2], DA], [2]) 表 
示 了 同样 的 队列 ， 而 相等 测试 却说 它们 是 不 同 的 。 

不 迁 明 签名 约束 。 用 符号 :> 取代 冒号 可 以 使 约束 变 成 不 透明 的 。 这 种 约束 隐藏 了 新 结构 
中 除了 签名 以 外 的 所 有 信息 。 让 我 们 通过 约束 具体 的 结构 来 建立 真正 抽象 的 队列 结构 : 

structure AbsQueuel :> QUEUE = Queuel; 

structure AbsQueue2 :> QUEUE = Queue2; 

structure AbsQueue3 :> QUEUE = Queue}; 
受 约束 的 结构 组 件 是 从 原来 结构 的 相应 部 分 中 分 离 出 来 的 ,结构 4bsQueuel 通 过 表 来 表示 队列 ， 
但 是 我 们 看 不 到 这 点 了 : 

AbsQueuel .deq ("We", "band", "of", “brothers"]; 

> Error: Type conflict:... 
类 似 地 ， 类 型 检测 可 以 防止 利用 构造 子 Queue3.Queue 来 拆散 结构 4bsQueune3 中 的 队列 。 相 等 
测试 也 被 禁止 了 : 

AbsQueue3 .empty = AbsQueue3 . empty; 

> Error: type ‘a AbsQueue3.t must be an equality type 
将 类 型 指定 为 eqtype ! 而 不 是 tyPe i 表示 该 类 型 允许 相等 测试 。 在 签名 中 使 用 eqtype 可 以 
输出 类 型 的 相等 测试 ， 即 使 是 在 不 透明 约束 中 。 

局 限 。 不 透明 签名 约束 对 于 声明 队列 的 抽象 类 型 来 说 是 非常 合适 的 。 抽 象 结构 可 以 从 现 
有 的 具体 结构 中 得 到 ， 就 像 上 面 的 AbsQueue 声 明 那 样 ， 或 者 我 们 可 以 直接 约束 原始 的 结构 

声明 : 


structure Queue :> QUEUE = struct ... end; 


不 过 ， 这 两 种 签名 约束 给 我 们 提供 的 是 非 此 即 彼 的 极端 选择 ， 这 对 于 复杂 的 抽象 类 型 来 说 很 
难 使 用 。 签 名 DICTION4R7Y 指 定 了 两 个 类 型 : key 是 搜索 键 值 类 型 ; a ! 是 字典 类 型 (4.14 节 ) 。 
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”类 型 a 应 该 是 抽象 的 ， 而 key 却 应 该 是 某 种 具体 的 类 型 ， 例 如 字符 串 。 否 则 的 话 ， 我 们 就 没有 


办 法 来 引用 键 值 了 ， 于 是 也 没 法 调用 lookup 和 update 了 ! 下 一 节 将 介绍 一 种 更 为 灵活 的 办 法 来 
声明 抽象 类 型 。 

练习 7.6 ”基于 表示 法 3， 说 明 只 用 抽象 队列 所 提供 的 操作 ， 怎 样 构造 内 部 表示 不 一 样 的 两 个 
相等 的 队列 。 

练习 7.7 扩展 签名 QUEUE， 增 加 函数 length 来 返回 队列 中 元 素 的 个 数 ， 以 及 equal 来 测试 两 ， 
个 队列 是 否 包含 同样 的 元 素 序 列 。 在 结构 Queunel1、Queue2 和 Queue3 中 加 入 这 些 函 数 的 声明 。 


7.6 抽象 类 型 (abstype) 声明 


Standard ML 有 一 种 专门 为 抽象 类 型 而 设 的 声明 形式 。 它 完全 隐藏 了 表示 方法 ， 包 括 相等 
测试 。abstype 声 明 源 自 第 一 个 ML 版 本 ， 它 体现 了 早期 结构 化 程序 设计 学 派 的 思想 。 现 在 
看 来 它 显 然 是 过 时 了 。 不 过 ， 它 比 不 透明 约束 更 具 选 择 性 : 它 可 以 有 选择 地 应 用 在 某 个 类 型 
上 ， 而 不 是 整个 签名 上 。 

简单 的 abstype 声 明 包 含 两 个 部 分 ， 数 据 类 型 绑 定 DB 和 声明 DD: 

abstype DB with D end 
数据 类 型 绑 定 是 一 个 后 面 跟着 构造 子 描述 的 类 型 名 字 ， 和 出 现在 datatype 声 明 中 的 完全 一 
样 。 构 造 子 在 声明 部 分 D 中 是 可 见 的 ， 那 里 必须 使 用 它们 来 实现 与 抽象 类 型 相关 的 所 有 操作 。 
在 D 中 声明 的 标识 符 和 类 型 名 对 外 都 是 可 见 的 ， 但 是 类 型 的 构造 子 被 隐藏 了 。 此 外 ， 这 个 类 型 
也 不 允许 进行 相等 测试 。 

为 了 说 明 abstype 声 明 ， 让 我 们 将 它 应 用 到 队列 上 。 声 明 本 来 应 该 包含 在 一 个 结构 中 以 
避免 与 内 署 的 表 国 数 ml 和 hd 发 生 名 字 冲 突 。 但 是 这 样 的 结构 会 使 例子 变 得 复杂 ， 我 们 就 简单 
地 在 此 另行 命名 。 为 了 节省 空间 ， 省 略 了 异常 。 

作为 表 的 队列 。 我 们 从 表示 法 1 开始 。 虽 然 lis! 已 经 是 一 个 数据 类 型 ， 但 是 abstype 声 明 
追 使 我 们 在 所 有 队列 操作 中 使 用 新 的 构造 子 (C1 )。 这 个 构造 子 传统 上 称 为 抽象 函数 
(abstraction function ) ， 它 将 具体 表示 映射 到 抽象 值 。 


abstype ‘a queue) = QI of ’a list 
with 
val empty = QI [1]; 


fun enqg(Ql q, x) = Ql (q @ [x]); 
fun qnull(Ql(x::q)) = false 


| qnull _ = true; 
fun qghd(Qi(x::q)) = x; 
fun deq(Qi(x::q)) = Ql qi 


end; 


作为 回应 ，ML 打 出 了 声明 过 的 标识 符 名 字 和 类 型 ; 


> type ‘a queuel 

> val empty = - : ‘a queuel 

> val enq = fn : ‘a queuel * ‘a -> ‘a queuel 
> 


val gnull = fn : ‘a gueuel -> bool 
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> val qhd = fn : ‘a queuel -> ‘a 
> val deq = fn : ‘a queuel -> ‘a queuej 
abstype 声 明 已 经 把 queue1 和 List 的 联系 隐藏 起 来 了 。 
作为 新 数据 类 型 的 队列 。 现 在 转向 表示 法 2。 之 前 我 们 把 构造 子 用 小 写字 母 命名 为 empity 
和 eng， 主 要 是 为 了 使 它们 在 外 部 可 以 作为 值 来 使 用 ， 但 那样 是 不 规范 的 。 现 在 abstype 隐 
藏 了 构造 子 ， 我们 又 可 以 使 用 大 写字 母 开头 的 名 字 Empty 和 Eng 了 ， 因为 终究 还 必须 显 式 地 输 
出 它们 的 值 : 
abstype ‘a queue2 = Empty 
| Eng of ‘a queue2 * ’a 
with 
val empty = Empty 
and eng = Eng 


fun qnull (Eng _) = false 
| qnull Empty = true; 
fun ghd (Enq(Empty,x)) = x 
| ghd (Eng (gq,x)) = ghd q; 
fun deq (Enq(Empty,x)) = Empty 
| deq (Eng(q,x)) = Enq(deq q, x); 


end; 


我 们 不 需要 声明 新 的 构造 子 22 了 ， 因 为 这 个 表示 法 本 身 需 要 它 自己 的 构造 子 。 除 了 队列 类 型 
的 名 字 外 ，ML 对 这 个 声明 的 回应 和 对 声明 gueue1 的 回应 完全 一 样 。 外 部 的 使 用 者 只 能 通过 输 
出 的 操作 来 处 理 队 列 。 

这 两 个 例子 说 明了 abstype 的 主要 特点 。 我 们 不 需要 再 看 queue3 的 类 似 声 明了 。 

ML 中 的 抽象 类 型 : 小结。 ML 对 待 抽象 类 型 的 处 理 并 没有 人 们 想像 的 那么 直接 ， 不 过 它 
也 可 以 被 简化 成 几 个 步 又 。 如 果 你 想 声 明 一 个 类 型 +， 并 只 人 允许 通过 你 选择 的 操作 对 其 进行 访 
问 ， 那 么 下 面 告 诉 你 如 何 进行 。 

1. 考虑 一 下 是 否 输 出 的 相等 测试 。 这 只 有 当 它 的 表示 允许 相等 测试 时 才 是 适合 的 ， 并 且 
这 个 相等 测试 要 和 抽象 值 的 相等 测试 一 致 才 行 。 另 外 也 要 考虑 相等 测试 实际 上 是 否 必要 。 对 
于 小 对 象 ， 如 日 期 和 有 理 数 ，、 进 行 相等 测试 是 适当 的 ， 但 对 于 和 矩阵 和 弹性 数组 则 不 然 。 

2. 声明 一 个 签名 SIG 来 描述 抽象 类 型 和 它 的 操作 。 如 果 类 型 允许 相等 测试 ， 那 么 签名 必须 
指定 :为 eqtype， 否 则 就 使 用 type。 

3. 决定 对 SIG 使 用 哪 一 种 签名 约束 。 不 透明 约束 只 有 当 签 名 中 的 所 有 类 型 都 是 抽象 类 型 时 
才 适 合 。 

4. 书写 结构 (RAT) 声明 的 框架 ， 和 上 一 步 选 择 的 约束 方式 联系 起 来 。 

5. 在 struct 和 end 框 住 的 块 内 声明 类 型 :和 所 需 的 操作 。 如 果 你 使 用 透明 签名 约束 ， 则 
它 必须 是 一 个 datatype 数 据 类 型 声明 (以 输出 相等 测试 ) 或 一 个 abstype 抽 象 类 型 声明 
(以 隐藏 相等 测试 ) 。 
datatype 声 明 也 可 以 产生 抽象 类 型 ， 这 是 因为 签名 约束 隐藏 了 构造 子 。abstype 或 
datatype 声 明 建 立 的 是 全 新 的 类 型 ，ML 认 为 不 同 于 所 有 其 他 的 类 型 。 

销 子 Dictionary 例 证 了 第 一 个 方案 ,而 环形 缓 训 区 结构 RingBuf 则 例证 了 第 二 个 方案 。 
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练习 7.8 ”早期 关于 抽象 类 型 的 文章 都 提 到 了 同一 个 例子 : 堆栈 。 有 关 的 操作 包括 了 push (将 
一 项 放 在 栈 顶 )，top (返回 栈 顶 项 ) 以 及 pop (丢弃 栈 顶 项 )。 除 此 之 外 ， 至 少 还 需要 另外 两 
个 操作 。 完 成 这 个 设计 并 使 用 abstype 编 写 两 个 不 同 的 实现 。 
练习 7.9 根据 练习 2.25 为 有 理 数 书写 一 个 abstype 声 明 。 使 用 1ocal 声 明 来 隐藏 任何 辅助 的 
函数 。 然 后 修改 你 的 解决 方案 以 得 到 符合 签名 4RITH 的 结构 。 


练习 7.10 为 日 期 类 型 date 设 计 并 编写 一 个 abstype 声 明 ， 它 用 月 和 日 来 表示 日 期 。( 假 设 本 
EREHE.) 提供 函数 today 来 将 月 和 日 转换 成 一 个 日 期 。 提 供 函 数 tomorrow (WHR) 和 
yesterday (昨天 )， 如 果 求 得 的 日 期 在 本 年 之 外 ， 它 们 应 该 抛 出 异常 。 


7.7 从 结构 导出 的 签名 


结构 声明 可 以 没有 签名 约束 ， 就 像 在 Queuel1、Queue2 和 Queue3 中 的 签名 那样 。 这 种 情况 
下 ，ML 将 自动 导出 一 个 完整 描述 结构 内 部 细节 的 签名 。 
签名 QUEUE1 等 价 于 为 结构 Queue1 而 导出 的 签名 。 它 将 ! 指 定 为 一 个 eqtype， 即 允许 相 
等 测试 的 类 型 ， 因 为 表 是 可 以 进行 相等 比较 和 的。 可 以 看 到 ， 值 的 类 型 使 用 了 类 型 a list， 而 不 
QUEUE Hat. 
signature QUEUEI1 = 
sig 
eqtype ‘at 
exception E 
val empty : ‘a list 


val en) : ‘a list * ‘a -> ‘a list 
val null : ‘a list -> bool 

val hd : ‘a list -> ‘a 

val deq : ‘a list -> ‘a list 
end; 


为 Gueue2 导 出 的 签名 将 a ! 描 述 为 一 个 数据 类 型 ， 并 具有 构造 子 empty 和 enq， 构 造 子 不 再 被 描 
述 成 值 。 这 个 签名 可 以 如 下 声明 : 


signature QUEUE2 = 
sig 
datatype ‘a t = empty | enq of ‘at * ‘a 
exception E 
val null : 'a t -> bool 


val hd : 'a t -> ‘a 
val deq : ‘at ->'‘at 
end; 


为 结构 Queue3 导 出 的 签名 同样 将 a i 找 述 为 一 个 数据 类 型 、 而 不 只 是 QUEUE 中 的 类 型 。 签 名 
中 描述 了 所 有 结构 中 的 项 目 ， 包 括 了 Queue 和 norm。 


signature QUEUE3 = 
sig 
Gatatype ‘a t = Queue of ‘a list * ‘a list 
exception E 
val empty : 'at 


val eng : ‘at*‘a->'at 
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val null : 'a t -> bool 
val hd : ‘at -> 'a 

val deq : 'at ->'at 
val norm : 'a t -> ar 


end; 


这 些 签名 比 CUEUE 更 具体 、 更 明确 。 没 有 结构 可 以 同时 满足 其 中 的 多 个 签名 。 可 以 考虑 
QUEUE1 和 QUEUE3。 函 数 hd 必须 具有 类 型 a list 以 满足 QUEUE1; 又 必须 具有 类 型 a t 以 满足 
QUEUE3， 后 者 还 将 a ! 描 述 为 数据 类 型 ， 显然 和 a list 不 同 。 

男 一 方面 ， 每 个 签名 可 以 有 很 多 不 同 的 实例 。 一 个 结构 可 以 通过 声明 x 为 任何 int 类 型 值 来 
满足 描述 val x: int。 它 可 以 通过 声明 任何 类 型 :来 满足 type t 的 描述 。( 但 是 ， 它 只 能 通过 完 


全 相同 的 datatype 声 明 来 满足 一 个 数据 类 型 描述 。) 结构 还 可 以 包含 签名 中 没有 描述 的 项 目 。 


由 此 可 见 一 个 签名 定义 了 一 类 结构 。 

这 些 类 之 间 存 在 着 有 趣 的 关系 。 我 们 已 经 知道 QUEUE1、QUEUE2 和 QUEUE3 互 不 相交 。 
后 两 个 包含 在 QUEUE 中 ; 一 个 QUEUE2 或 GQUEUE3 的 实例 也 是 QUEUE 的 实例 。 一 个 QUEUE!1 
的 实例 只 有 当 它 令 类 型 a 1 等 价 于 a list 时 才能 成 为 OUEUE 的 实例 。 这 些 包含 关系 显示 在 下 面 
的 维 恩 图 中 : 





练习 7.11 声明 一 个 结构 使 其 具有 签名 QUEUE1， 并 以 不 同 于 Queunel 的 表示 方法 实现 队列 。 


练习 7.12 声明 一 个 结构 使 其 具有 签名 QUEUE， 但 是 不 需要 实现 队列 。 毕 况 签 名 只 描述 了 队 
列 操作 的 类 型 ， 而 不 是 它们 的 性 质 。 


AF 


ML 的 函数 是 具有 参数 的 表达 式 。 对 它 的 应 用 是 将 形式 参数 替换 成 实际 参数 值 ， 然 后 返回 
所 得 到 的 表达 式 的 值 。 函 数 只 能 应 用 在 具有 正确 类 型 的 参数 上 。 

我 们 有 几 种 队列 的 实现 。 能 否 书写 一 种 使 用 队列 ， 但 又 独立 于 任何 特定 队列 实现 的 代码 
呢 ? 这 好 像 需要 将 结构 作为 参数 。 

函数 本 身 也 可 以 作为 参数 ， 因 为 在 ML 中 函数 也 是 值 的 一 种 。 记 录 也 是 值 ， 它 们 有 点 像 结 
构 ， 但 是 不 能 表示 队列 的 实现 ， 因 为 记录 里 面 不 能 包含 类 型 和 异常 构造 子 作 为 分 量 。 

ML 的 函 子 〈functor) 是 一 个 以 其 他 结构 作为 参数 的 结构 。 对 它 的 应 用 是 将 形式 参数 替换 
为 实际 的 结构 参数 ， 然 后 返回 结果 结构 中 出 现 的 绑 定 。 函 子 只 能 应 用 到 具有 正确 签名 的 结构 
参数 上 。 
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函 子 允 许 我 们 书写 以 不 同方 式 组 合 的 程序 单元 。 一 个 替换 单元 可 以 很 快 地 连接 进来 ， 得 
到 的 新 系统 也 可 以 很 快 地 进行 测试 。 了 洋子 也 可 以 表达 泛 型 算法 。 让 我 们 看 看 这 是 怎样 做 的 。 


7.8 测试 多 个 队列 结构 


下 面 是 一 个 简单 的 队列 测试 框架 。 给 定 一 个 队列 结构 、， 它 返回 一 个 测试 结构 ， 里 面 含有 
两 个 函数 。 一 个 将 表 转 换 为 队列 ; 另 一 个 则 是 前 一 个 的 逆 操 作 。 测 试 框 架 声 明 为 一 个 函 子 ， 
具有 签名 为 GUEUE 的 结构 参数 : 


functor TestQueue (Q: QUEUE) = 
struct 


fun fromList l = foldl (fn (x,q) => Q.enqg(q,x)) Q.empty l; 


fun toList q = if Q.null q then [] 
else Q.hd q :: "toList (Q.deq q); 
end; 
> functor TestQueue : <sig> 


函 子 内 并 没有 引用 现 有 的 队列 结构 ， 而 是 引用 参数 OQ。 两 个 函数 一 致使 用 了 队列 操作 。 任 何 队 
列 结构 都 可 以 进行 测试 ， 并 测量 它 的 效率 。 让 我 们 从 Queue3 开 始 。 将 函 子 应 用 到 这 个 参数 上 
得 到 一 个 新 的 结构 ， 我 们 称 为 Test0Q3。Test83 的 组 件 就 是 测试 Queue3 的 函数 ， 这 也 可 以 从 它 
们 的 类 型 中 看 到 : 


structure TestQ3 = TestQueue (Queue3) ; 
> structure TestQ3 : 


> sig 
> val fromList : ‘a list -> ‘a Queue3.t 
> val toList : ‘a Queue3.t -> ‘a list 
> end 


测试 用 的 数据 就 是 从 1 到 10 000 的 整数 表 : 


val ns = upto(1,10000); 

> val ns = [1, 2, 3, 4, ...] : int list 

val q3 = TestQ3.fromList ns; 

> val q3 = Queue ({1], [10000, 9999, 9998, 9997, ...]) 
> : int Queue3.t : 

val 13 = TestQ3.toList q3; 

> val 13 = [1, 2, 3, 4, ...] : int list 

B = ns; 

> true : bool 


Queue3 通 过 了 它 的 第 一 个 测试 ， 我 们 取 回 了 原来 的 表 。 它 的 效率 很 高 ， 只 用 了 10 毫 秒 就 建立 
了 4q3， 又 用 了 50 毫 秒 来 将 它 转 回 到 一 个 表 。 

ML 对 于 g3 声 明 的 回应 暴露 了 它 使 用 一 对 表 来 表示 队列 的 方法 : Quene3 没 有 定义 抽象 类 型 。 
应 该 试 试 结构 AbsCuexe3。 同 样 ， 我 们 应 用 该 函 子 并 给 结果 结构 命名 : 


structure TestAQ3 = TestQueue (AbsQueue3) ; 
> structure TestAQ3 : 


> sig 
> val fromList : ‘a list -> ‘a AbsQueue3.t 
> val toList : ‘a AbsQueue3.t -> ’a list 
> end 
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val q = TestAQ3.fromList ns; 
> val q = ~- : int AbsQueue3.t 


这 次 ML 没有 暴露 任何 表示 方法 。 在 效率 方面 ，Quene3 和 AbsQueue3 没 有 区 别 。 类 似 的 评测 显 
示 AbsQueue3 比 Queue1 和 Queue2 快 很 多 倍 ， 比 练习 7.4 所 建议 的 平衡 树 实现 也 快 不 少 。 由 于 
Queue1 是 用 表 来 表示 队列 的 ， 它 可 以 专门 实现 高 效 的 fromList 和 1oList， 但 是 在 函 子 内 ， 我 们 
只 能 使 用 签名 QUEUE 中 所 指定 的 操作 。 

更 为 实际 的 测试 将 涉及 到 队列 的 应 用 ， 例 如 广度 优先 搜索 。 函 数 breadthFirst (5.17%) 
为 了 简单 起 见 使 用 了 表 来 代替 队列 。 使 用 函 子 可 以 独立 地 表达 这 个 搜索 策略 ， 而 不 依赖 队列 
的 实现 。 


functor BreadthFirst (Q: QUEUE) = 
struct 
fun englist q xs = foldl (fn (x,q) => Q.enq(q.x)) q xs; 
fun search next x = 
let fun bfs q = 
if Q.null q then Nil else 
let val y = Q.hd q 
in Cons(y, fn()=> bfs (englist (Q.deq q) (next y))) 
end 
in bfs (Q.enq(Q.empty, x)) enä; 
end; 
> functor BreadthFirst : <sig> 


函数 englist 将 整个 表 的 元 素 追 加 到 队列 尾部 。 让 我 们 将 这 个 函 子 应 用 到 一 个 高 效 的 队列 结 
构 上 : 


structure Breadth = BreadthFirst (Queue3) ; 
> structure Breadth : 


> sig 

> val enqlist : ‘a Queue3.t -> ‘a list -> ‘a Queue3.t 
> val search : (fa -> ‘a list) -> ‘a -¥ ‘a seq 

> end 


函数 Breadth.search 等 价 于 breadthFirst， 不 过 要 快 得 多 。 

很 多 语言 没有 入 子 类 似 的 机 制 。 C 语 言 通过 使 用 头 文件 和 包含 文件 来 取得 类 似 的 效果 。 
像 这 样 的 原始 方法 虽然 大 有 帮助 ， 但 是 它们 不 能 处 理 错 误 。 包 含 错误 的 文件 导致 错误 的 代码 
被 编译 : 我 们 会 得 到 很 多 野 的 错误 信息 。 如 果 函 子 应 用 到 了 错误 的 结构 上 又 会 怎样 呢 ? 试 试 
将 BreadthFirst 应 用 到 标准 库 结 构 List 上 : 

structure Wrong = BreadthFirst (List); 

> Error: unmatched type spec: 上 

> Error: unmatched exception spec: E 

> Error: unmatched val spec: empty 

> Error: unmatched val spec: enq 

> Error: unmatched val spec: deq 
我 们 可 以 得 到 确切 的 错误 信息 ， 它 描述 了 参数 里 面 缺少 了 什么 。 上 面 没有 提示 缺少 hd 和 ml， 
因为 List 里 面 有 同名 的 组 件 。 

将 队列 结构 作为 参数 所 造成 的 复杂 可 能 是 没有 必要 的 。AbsQueue3 是 最 好 的 队列 结构 ， 我 
们 可 以 将 它 改名 为 Cuere 来 直接 使 用 ， 就 像 使 用 标准 库 里 的 结构 ， 如 Pist， 一 样 。 但 是 通常 我 
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们 是 有 选择 的 。 存 在 着 多 个 可 能 的 字典 和 优先 队列 的 表示 法 。 即 便 在 标准 库 中 也 有 多 个 各 有 
千秋 的 结构 来 处 理 实数 运算 。 在 考虑 泛 型 操作 的 时 候 ， 函 子 的 作用 是 不 容 置疑 的 。 

练习 7.13 考虑 在 其 他 你 了 解 的 语言 中 怎样 获得 ML 模块 的 效果 。 你 会 怎样 表达 类 似 QUEUE 
的 签名 ， 可 替换 结构 Queuel1 和 Queue2， 以 及 函 子 TestQueue? 


练习 7.14 在 什么 范围 内 ，TestQueue 是 测试 队列 的 好 工具 ? 
7.9 泛 型 矩阵 运算 


有 关联 的 结构 除了 性 能 以 外 还 有 其 他 不 同 点 。2.22 节 中 我 们 讨论 过 签名 ARITH， 它 描述 了 
zero、sum、d 访 、prod 等 几 个 组 件 。 适 合 这 个 签名 的 实例 包括 了 实现 整数 、 实 数 、 复 数 和 有 理 
数 上 的 运算 结构 。 第 3 章 进一步 提 到 了 更 多 的 可 能 性 : 二 进 制 数 、 和 矩阵 和 多 项 式 。 

为 了 说 明 函 子 ， 让 我 们 为 矩阵 运算 编写 一 个 泛 型 结构 。 为 了 简单 起 见 ， 我 们 只 考虑 零 、 
求 和 以 及 乘积 : 

signature ZSP = 

sig 

type 上 

val zero : t 

val sum : t * t -> t 
val prod: t * t -> t 
end; 


我 们 将 声明 一 个 函 子 、 它 的 参数 和 结果 结构 都 符合 签名 ZSP。 


声明 矩阵 六 子 。 已 知 一 个 类 型 :和 它 的 三 种 算术 操作 ， 函 子 MatrixZSP 声 明了 t 上 的 矩阵 类 
型 和 相应 的 矩阵 运算 (图 7-1)。 在 研究 这 个 函 子 体 之 前 ， 不 妨 复习 一 下 3.10 节 。 


functor MatrixZSP (Z: ZSP) : ZSP = 
struct 
type t = Z.t list list; 


val zero = {]; 


fun sum (rowsA, [)) = rowsA 

| sum ({),rowsB) = rowsB 

| sum (rowsA,rowsB) = ListPair.map (ListPair.map Z.sum) 
(rowsA , rowsB) ; 


fun dotprod pairs = foldl Z.sum Z.zero (ListPair.map Z.prod pairs) ; 


fun transp ([]::_) {] 
| transp rows map hd rows :: transp (map tl rows); 


fun prod (rowsA,[]) = [] 
| prod (rowsA,rowsB) = 
let val colsB = transp rowsB 
in map (fn row => map (fn col => dotprod(row,col) ) 
colsB) 


end; 





图 7-1 泛 型 矩阵 运算 的 函 子 
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在 国 子 头 中 ， 第 二 次 出 现 的 ZSP 是 返回 结构 的 签名 约束 。 因 为 这 个 约束 是 透明 的 ， 所 以 


MatrixZSP 不 会 返回 抽象 类 型 。 假 如 使 用 不 透明 约束 ， 那 么 就 只 能 通过 输出 的 零 、 求 和 以 及 乘 ， 


积 来 对 矩阵 进行 操作 : 我 们 将 只 能 表达 零 矩 阵 ! 而 现在 的 写法 ， 人 允许 将 矩阵 写成 表 的 表 。 

返回 的 结构 根据 矩阵 的 元 素 类 型 Z.! 声 明了 矩阵 的 类 型 +。 这 个 声明 是 结果 签名 所 要 求 的 ， 
签名 里 面 指定 了 类 型 +。 在 纯 子 体 中 并 没有 使 用 它 。 

然后 ， 结 构 里 声明 了 zero。 在 代数 中 ， 任何 m x nS Src KEE AB EHH (zero 
matrix )。 签 名 ZSP 中 描述 的 zero : t 要 求 我 们 声明 唯一 的 一 个 零 元 素 。 因 此 ， 销 子 中 将 zero 声 明 
为 空 表 ， 并 使 得 sum 和 prod 满 足 定律 0+ A=A+0=A4 以 及 0xA=Ax0=0。 

结构 声明 了 函数 sum， 用 于 计算 两 个 矩阵 相 加 。 通 过 将 行 中 对 应 元 素 相 加 来 将 两 行 相 加 ， 
这 里 使 用 了 库 函 数 ListPair.map。 类 似 地 ， 两 个 矩阵 相 加 是 通过 对 应 行 的 相 加 来 完成 的 。 和 矩阵 
的 加 法 sum 和 和 矩阵 元 素 的 加 法 Z.sum 之 间 并 无 冲突 。 

结构 中 的 其 他 函数 是 为 了 辅助 乘积 函数 prod 的 声明 而 设 。 点 积 的 计算 也 是 通过 

ListPair map ER, 而 矩阵 转 置 则 是 像 5.7 节 中 那样 声明 的 。 由 于 transp 不 能 处 理 空 表 ， 因 
此 国 数 prod 要 处 理 这 种 特殊 情形 。 

因为 ListPair 中 的 函数 都 丢弃 了 无 法 匹配 的 多 余 表 元 素 ， 所 以 这 里 没有 检测 和 矩阵 的 大 小 。 
于 是 ， 将 2 x 5 的 矩阵 和 3 x 4 的 矩阵 相 加 会 得 到 一 个 2 x 4 的 和 矩阵， 而 不 会 抛 出 异常 。 

数值 应 用 。 在 应 用 上 面 这 个 函 子 之 前 ， 必 须 先 创建 一 些 结构 。 我 们 已 经 看 过 实数 征 阵 了 ， 
现在 轮 到 整数 矩阵 了 。 结 构 ImtZSP 恰 好 包括 ZSP 所 描述 的 那些 操作 : 


structure IntZSP = 


struct 
type t = int; 
val zero = 0; 
fun sum (x,y) = x+y: t; 
fun prod (x,y) = x*y: t; 
end; 
> structure IntZSP : 
> sig 
> eqtype 上 
> val prod : int * int -> t 
> val sum : int * int -> t 
> val zero : int 
> end 


将 上 面 的 函 子 应 用 到 1ntZSP 之 上 可 以 为 整数 矩阵 上 的 运算 建立 一 个 结构 。 这 里 举 两 个 例子 ， 


naan, JE J-E onl J.C J-E 3) 


© structure IntMatrix = MatrixZSP (IntZSP); 
> structure IntMatrix : ZSP 
IntMatrix.sum (((1;,2),(3,4]], ((5,61],£7,8]1); 
> [[6, 8], [10, 12]] : IntMatrix.t 
IntMatrix.prod (((1,2],(3,4]], ((0,1],{1,0]]); 
> [{2, 1], (4, 3]] : IntMatrix.t 


2.21 节 中 声明 的 结构 Complex 里 的 一 些 组 件 并 没有 在 ZSP 中 进行 描述 。 不 过 ， 签 名 匹配 会 忽略 
额外 的 组 件 。 因 此 ， 我 们 可 以 将 这 个 结构 作为 MatrixZSP 的 参数 ， 产 生 的 结果 是 复数 矩阵 运算 
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structure ComplexMatrix = MatrixZSP (Complex) ; 
> structure ComplexMatrix : ZSP 


将 一 个 结构 运用 于 多 种 目的 的 技巧 是 保持 程序 简洁 的 有 力 工具 。 首 要 的 是 ， 这 需要 精心 设计 
的 签名 。 一 致 的 命名 习惯 可 以 帮助 保证 不 同 的 模块 间 彼 此 配合 。 
图 论 应 用 。 组 件 zero、sum 和 prod 并 不 一 定 要 有 明显 的 数值 解释 。 许 多 图 论 算法 都 是 在 算 
阵 上 操作 的 ， 这 些 和 矩阵 对 (关于 元 素 的 ) 0、+ 和 x 有 出 人 意外 的 解释 。 
由 n 个 结 点 组 成 的 有 向 图 可 以 用 n x n 48 4 $e (adjacency matrix) KER. METR, J) 
是 一 个 布尔 值 ， 代 表 是 否 存在 一 条 由 结 点 i 到 结 点 /的 边 。 典 型 的 矩阵 操作 将 元 素 zero 解 释 成 假 ， 
而 sxm 是 析 取 ，prod 是 合 取 。 
structure BoolZSP = 
struct 
type t = bool; 
val zero = false; 
fun sum (x,y) = x orelse y; 
fun prod (x,y) = x andalso y; 
end; 
> structure BoolZSP : 
> sig 
> eqtype t = bool 
> val prod : bool * bool -> bool 
> val sum : bool * bool -> bool 
> val zero : bool 
> end 


若 4 是 一 个 布尔 邻接 年 阵 ， 并 且 由 4 给 出 的 图 中 从 ;到 j 恰 有 一 条 长 度 为 2 的 路 径 ， 则 4 x 4 就 表示 
了 这 样 一 个 图 : 它 有 一 条 从 ;型 /的 边 。 和 矩阵 运算 可 以 计算 出 图 的 传递 闲 包 。 然 而 ， 位 操作 (在 
标准 库 的 结构 Word8 中 ) 可 以 更 快 地 进行 这 样 的 计算 ， 因 此 ， 让 我 们 转 而 看 看 另 一 个 更 非 同 寻 
常 的 例子 。 

将 zero 定 义 为 无 穷 大 ( % ) 、sum 定 义 为 最 小 值 (min) 以 及 将 prod 定 义 为 和 (+)。 除 去 无 
穷 以 外 的 其 他 操作 对 于 无 穷 大 进行 了 如 下 推广 :min(m , x)= minx, ©) = xb +x = x+ o= 
u 。 这 样 一 来 ， 三 元 组 (w ,min, +) 多 少 满足 了 与 (0, +,x ) 同 样 的 定律 。 然 而 ， 这 样 奇怪 的 算术 
运算 又 有 什么 意义 呢 ? 

考虑 这 样 一 个 有 向 图 ， 它 的 边 被 标记 上 数值 ， 以 表示 延 该 边 通过 的 代价 。( 有 可 能 是 负 
数 ! ) 相应 的 邻接 矩阵 的 元 素 就 是 一 些 数值 。 元 素 (i, 有 ) 就 是 从 i 到 j 的 边 的 代价 ， 或 者 如 果 是 无 
穷 的 话 则 表示 没有 这 条 边 。 设 4 是 一 个 邻接 矩阵 ， 并 使 用 上 面 奇特 的 算术 运算 来 计算 4 x A. 
乘积 的 元 素 (i, 让 是 从 i 到 j 长 度 为 2 的 诸 路 径 的 最 小 代价 。 我 们 有 了 必需 的 方法 ， 用 它 可 以 表达 
这 个 计算 图 中 所 有 结 点 间 最 短路 径 的 标准 算法 。 

下 面 就 是 实现 这 个 奇特 运算 的 结构 。 它 是 基于 int 类 型 的 。 它 并 没有 将 zero 声 明 为 无 穷 大 ， 
而 是 一 个 很 大 的 整数 。。 它 将 sum 声 明 为 标准 库 中 的 最 小 值 函 数 ， 并 且 将 prod 声 明 为 加 法 的 
推广 。 


日 ”标准 库 中 nt 结构 的 组 件 maxiInt 要 么 形 如 SOME n， 其 中 n 是 可以 表示 的 最 大 整数 ， 要 么 形 如 NONE。 任 何 超 
过 所 有 边 标 记 的 绝对 值 和 的 整数 都 是 适用 的 。 
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structure PathZSP = 
struct 
type t = int; 


val SOME zero = Int.maxint; 

val sum = Int.min 

fun prod(m,n) = if m=zero orelse n=zero then zero 
else m+n; 


end; 


将 我 们 的 函 子 应 用 到 这 个 结构 上 便 生成 了 奇特 的 矩阵 运算 结构 。“ 所 有 结 点 间 最 短路 径 ” 的 算 
法 可 以 仅 用 几 行程 序 编写 : 


structure PathMatrix = MatrixZSP (PathZSP) ; 
> structure PathMatrix : ZSP 


fun fast_paths mat = 
let val n = length mat 
fun f (m,mat) = if n-1 <= m then mat 
else f(2*m, PathMatrix. prod (mat, mat) ) 
in f (1, mat) end; 
> val fast_paths = fn : PathMatrix.t -> PathMatrix.t 
Cormen% (1990) 讨论 了 这 个 算法 (26.1 节 )。 我 们 来 试 一 下 其 中 的 一 个 例子 。 给 定 一 个 五 结 
点 图 的 邻接 和 矩阵 ，fast_paths 返 回 预期 的 结果 : 


val zz = PathZSP.zero; 


val zz > 1073741823 : int 

fast.paths [[0, 3 8, z, “4], 
[zz, 0 wz, 21 7). 
(zz, 4 0, z, z) 
[2, zz, 75, 0 zi, 
[zz， Z, Zz, 6 01]; 

> [[0, 1, “3, 2, 74] 

> [3, 0, ~4, 1, ~1], 

> [7, 4, 0, 5, 3], 

> [2, ~1, ~5, 0, 72), 

> [8 5, 1, 6 0]] : PathMatrix.t 


国 子 MatrrixzZSP 的 参数 是 仅 有 四 个 组 件 的 结构 。 下 节 将 会 看 到 ， 甚 至 更 小 的 结构 也 都 有 它们 的 
用 途 。 


O 一 个 代数 的 视角 。Cormen 等 (1990) 更 进一步 地 给 这 个 奇特 的 运算 建立 了 完整 
的 基础 。 他 们 (26.4 节 ) 定义 了 闭合 半 环 (closed semiring) 的 记 法 ， 并 讲述 了 它 和 
路 径 算法 的 联系 。 闭 合 半 环 涉及 了 类 似 于 0、1、+ 和 x 的 操作 ， 它 们 满足 一 系列 代数 
定律 : + 和 x 要 满足 交换 律 和 结合 律 等 等 。 关 于 闭合 半 环 的 签名 需要 在 ZSP 上 补充 一 
个 组 件 : one (一 )。ML 的 模块 对 于 将 这 样 的 抽象 付 诸 使 用 来 说 是 非常 理想 的 。 


练习 7.15 ”声明 另 一 版 本 的 PathZSP， 其 中 将 “表示 为 特殊 的 值 ， 而 不 等 于 任 一 个 整数 。 这 
样 的 结构 适用 于 类 似 Poly/ML 这 样 的 ML 系统 ， 在 这 些 系统 中 ， 类 型 int 没 有 最 大 值 。 

练习 7.16 ” 算 阵 并 不 一 定 要 是 表 的 表 。 研 究 标准 库 中 的 向 量 结构 Vector， 然 后 书写 一 个 函 子 
VMarrixZSP， 将 矩阵 表示 为 向 量 的 向 量 。 
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710 泛 型 的 字典 和 优先 队列 


在 第 4 章 ， 我 们 实现 了 字符 串 上 的 二 叉 搜 索 树 ， 以 及 实数 上 的 优先 队列 。 我 们 可 以 利用 范 
子 来 取消 类 型 上 的 限制 ， 将 这 两 个 数据 结构 推广 到 任意 的 有 序 类 型 。 有 序 类 型 以 及 它 的 比 序 
函数 将 包装 在 含有 两 个 组 件 的 结构 中 。 

排序 也 可 以 类 似 地 进行 推广 一 一 并 不 需要 国 子 。 只 需 简单 地 将 比 序 国 数 作 为 参数 传人 ， 
将 排序 表示 成 一 个 高 阶 函 数 。 但 是 ， 这 种 办 法 之 所 以 可 行 ， 仅 仅 是 由 于 排序 是 一 种 一 体 化 的 
操作 。 将 优先 队列 的 那些 操作 变 为 高 阶 函数 会 使 得 一 些 莞 雇 的 做 法 成 为 可 能 ， 例 如 用 一 种 蜂 
序 插 和 项目， 而 用 另 一 种 顺序 删除 项 目 。 

有 序 类 型 作为 结构 。 数 学 家 将 有 序 集 定义 为 一 个 序 偶 (4, <)， 其 中 4 是 集合 ，< 是 4 上 满足 
传递 等 性 质 的 关系 。ML 的 模块 可 以 表示 这 样 的 数学 概念 ， 尽 管 记 法 比较 难看 。 签 名 ORDER 
描述 了 一 个 类 型 :和 一 个 比 序 函 数 compare: 

signature ORDER = 

sig 
type t 


val compare: t*t -> order 
end; 


回忆 一 下 ，ML 库 将 order 声 明 为 一 个 枚 举 类 型 ， 它 具有 三 个 构造 子 : LESS. EQUALA 
GREATER。 像 String、Int 和 Real 这 样 的 库 结 构 都 含有 组 件 compare ， 这 个 函数 有 两 个 同样 的 相 
应 类 型 的 操作 数 。 举 例 来 说 ， 我 们 可 以 这 样 包装 字符 串 比 序 
structure StringOrder: ORDER = 

struct 

type t = string; 

val compare = String .compare 

end; 

> structure StringOrder : ORDER 
我 们 可 以 定义 自己 的 比 序 函数 ， 但 是 需要 注意 ， 二 又 搜 索 树 要 求 序 是 线性 的 《linear)。 一 个 
E < 是 线性 的 当 它 满足 ， 对 于 所 有 的 x 和 y,，x < y、x = y 和 x > y 三 者 有 且 仅 有 一 个 成 立 。 在 这 
里 ， 它 的 意思 是 : 如 果 比 较 的 结果 是 EQUAL 的 话 ， 那 么 两 个 操作 数 就 确实 是 相等 的 。 对 于 优 
先 队列 ， 我 们 可 以 使 用 偏 序 ， 也 就 是 说 ， 如 果 两 项 比较 结果 是 EQUAL 只 是 说 明 两 者 具有 相同 
的 优先 级 ， 即 使 它们 本 身 是 不 同 的 。( 但 是 ， 还 请 参见 下 面 的 练习 7.23。 ) 

字典 函 子 。4.14 节 通过 声明 签名 DJICT7ON4RY 来 勾勒 出 字典 的 各 项 操作 ， 并 且 使 用 二 又 搜 
索 树 来 实现 。 这 个 实现 有 两 个 方面 的 缺陷 ， 一 个 是 键 值 被 人 为 地 限制 在 类 型 string 上 ， 另 一 个 
是 树 的 表示 方法 从 结构 外 部 是 可 见 的 。 

新 的 实现 方法 是 (图 7-2) 通过 将 有 序 结构 作为 参数 来 弥补 第 一 个 缺陷 ， 第 二 个 缺陷 则 是 
通过 abstype 声 明 的 方式 来 弥补 。 这 个 实现 禁止 了 相等 测试 ， 这 是 因为 不 同 的 二 又 搜索 树 可 
能 表示 同样 的 字典 。 : 

函 子 头 告 诉 我 们 ， 仅 有 的 键 值 操作 只 是 比较 。 函 子 体 则 类 似 于 之 前 有 缺陷 的 结构 ， 只 不 
过 它 使 用 了 其 参数 Key.compare 而 不 是 String .compare 来 进行 比较 。 并 且 ， 函 子 将 键 值 类 型 key 
声明 作 Key.t， 而 在 旧 的 结构 中 ， 这 个 类 型 是 string。 

将 函 子 Dictionary 应 用 到 结构 StringOrder 上 就 建立 了 以 字符 束 作为 键 人 的 字典 结构 。 
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structure StringDict = Dictionary (StringOrder) ; 
> structure StringDict : DICTIONARY 










functor Dictionary (Key: ORDER) : DICTIONARY = 
struct 


type key = Key.t; 





abstype ‘a t = Leaf 
| Bran of key * ‘a * ‘at * ‘at 










with 
exception E of key; 
val empty = Leaf; 


fun lookup (Leaf, b) = raise Eb 
| lookup (Bran(a,x,t1,t2), b) = 
(case Key.compare(a,b) of 
GREATER => lookup (tl, b) 
| EQUAL => x 
| LESS => lookup(12, b)); 














fun insert (Leaf, b, y) = Bran(b, y, Leaf, Leaf) 
| insert (Bran(a,x,tl,t2), b, y) 
(case Key.compare(a,b) of 
GREATER => Bran(a, x, insert(tl,b,y), 12) 
| EQUAL => raise E b. 
| LESS => Bran(a, x, tl, insert(t2,b,y))); 


il 







update (Leaf, b, y) 
| update (Bran(a,x,ti,t2), b, y) 
(case Key.compare(a,b) of 
GREATER => Bran(a, x, update(ti,b,y), 12) 
| EQUAL => Bran(a, y, tl, 2) 
| LESS => Bran(a, x, tl, update(t2,b,y))); 


it 


Bran(b, y, Leaf, Leaf) 


H 





图 7-2 作为 二 又 搜索 树 的 字典 函 子 


现在 可 以 创建 和 搜索 字典 了 。 这 里 ， 声 明 一 个 中 缀 操作 符 可 以 消除 难看 的 对 于 update 的 峰 套 
调用 : - 

infix |> ; 

fun (d |> (k,x)) = StringDict.update(d,k,x); 


val dict = StringDict . empty 
|> ("Crecy",1346) 
|> ("Poitiers",1356) 
|> ("Agincourt",1415) 
|> ("Trafalgar",1805) 
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|> ("Waterloo",1815); 
> val dict = - : int StringDict.t 
StringDict . lookup (dict, "Poitiers"); 
> 1356 : int 


优先 队列 : 一 个 子 结构 的 例子 。4.16 节 通过 声明 签名 PRIORI1T7_CUEUE 勾 勒 了 优先 队列 
的 各 个 操作 ， 并 使 用 二 又 树 来 实现 它 。 该 实现 同样 具有 字典 的 那 两 个 缺陷 。 与 其 再 盖 述 一 遍 
相同 的 思想 ， 不 如 让 我 们 来 看 一 些 新 东西 : 子 结构 。 

字典 和 优先 队列 的 一 个 区 别 在 于 有 序 所 扮演 的 角色 。 字 典 函 子 以 有 序 结构 作为 参数 是 因 
为 它 使 用 了 搜索 树 ， 另 一 种 实现 可 能 是 以 相等 测试 或 散 列 函数 作为 参数 。 然 而 ， 优 先 队 列 在 
本 质 上 是 关于 有 序 的 : 在 积累 了 一 定数 量 的 项 目 后 ， 它 首先 返回 最 小 的 那 一 项 。 因 此 ， 我 们 
来 修改 一 下 最 后 的 签名 ， 来 显 式 地 描述 有 序 结构 : 


signature PRIORITY.QUEUE = 


sig 

structure Item : ORDER 

type t ' 

val empty : t 

val null : t -> bool 

val insert : ltem.t * t -> t 
val min : t -> 17e .1 
val delmin : t ->t 

val fromList : Hem.t list -> t 
val toList : t -> Item.t list 
val sort : ltem.t list -> Item.t list 
end; f 


签名 PRIORI1T7_ OUEUE 中 描述 了 一 个 子 结构 item ， 它 与 签名 ORDER 匹配 。 项 的 类 型 是 ftem .1， 
而 优先 队列 的 类 型 则 是 +。 因 此 ， 返 回 队列 中 最 小 项 的 函数 min 具 有 类 型 1 一 Item.t. 

所 有 优先 队列 结构 都 内 含 了 有 序 结构 。 如 果 PQueue 是 该 签名 的 一 个 实例 ， 就 可 以 通过 
书写 

PQueue . item . compare (x,y) 
来 比较 x 和 ?>。 在 这 一 方案 下 ， 系 统 组 件 被 描述 为 子 结 构 。 前 一 个 版 本 的 PRIORIT7_CUVEUE 将 
项 目 描述 为 类 型 item， 而 不 是 结构 item， 许 多 人 都 喜欢 它 的 简单 性 。 

相应 的 函 子 勾勒 如 下 。 函 子 体 的 大 部 分 都 忽略 掉 了 ， 这 部 分 类 似 于 第 4 章 的 图 4-4。 


functor PriorityQueue (Item: ORDER) : PRIORITY-QUEUE = 
struct 
structure Item = Item; 


fun x <= y = (ltem.compare(x,y) <> GREATER) ; 
abstype t=... 

with 

end 
end; 


其 中 结构 ltem 的 声明 看 上 去 没什么 用 ， 因 为 Hem 在 函 子 体 中 已 经 是 可 见 的 了 ， 但 是 结果 签名 需 
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常 简单 ， 所 有 允许 在 顶层 声明 的 形式 都 可 以 出 现在 另 一 个 结构 中 。 

土 面 的 函 子 重新 声明 了 中 缀 操作 符 <=， 用 以 表示 项 上 的 “小 于 或 等 于 ”。 在 第 4 章 ， 二 
树 使 用 compare 来 进行 比 序 ， 而 优先 队列 则 使 用 <=。 为 两 个 国 子 声 明 两 种 不 同 的 签名 是 不 合理 
的 ， 同 样 也 不 应 该 描述 所 有 的 关系 操作 符 。 简 单 统一 的 接口 将 使 模块 更 易于 配合 。 

abstype 声 明 可 以 使 用 全 新 的 树 构 造 子 ， 就 像 在 Dictionary 中 一 样 。 或 者 也 可 以 通过 一 个 
类 似 之 前 的 抽象 类 型 guexuel 中 那样 的 哑 构 造 子 来 使 用 已 有 的 构造 子 Cf 和 Br (4.13 节 中 声明 在 
顶层 )。 
练习 7.17 书写 一 个 新 版 本 的 孙子 Dictionary， 将 字典 表示 为 序 偶 (key, item) 的 表 ， 表 中 元 素 
根据 键 值 排序 。 
练习 7.18 ”完成 上 面 的 abstype 声 明 ， 尝 试 所 述 的 两 种 选择 。 你 喜欢 镭 一 种 ? 
练习 7.19 ”书写 一 个 新 版 本 的 六 子 PriorityQueue ， 将 优先 队列 表示 为 一 个 升序 表 ， 而 不 是 二 
叉 树 。 
练习 7.20 ”书写 一 个 国 子 Sorting ， 它 以 签名 ORDER 的 实例 作为 参数 ， 其 结果 结构 要 实现 快速 
排序 及 合并 排序 。 提 供 两 种 以 上 排序 算法 的 出 发 点 是 什么 ? 


利用 模块 建立 大 型 系统 


通过 一 些小 例子 ， 我 们 已 经 了 解 了 模块 语言 的 基本 功能 。 我 们 已 经 看 到 过 很 多 种 结构 的 
使 用 方法 : 

。 库 结构 List 包 含 了 相关 的 声明 ， 但 是 ， 我 们 可 以 用 表 的 构造 子 写 出 更 多 的 声明 。 

。 结 构 AbsQueue3 输 出 了 一 个 抽象 类 型 ， 以 及 它 的 所 有 基本 操作 。 更 多 关于 队列 的 操作 只 

能 用 这 些 基本 操作 来 表示 。 

。 满 足 签名 ZSP 的 那些 结构 是 作为 一 个 国 子 的 参数 或 结果 来 使 用 的 。 它 们 只 有 几 个 组 件 ， 

也 就 是 那些 与 函 子 相 关 的 操作 。 
一 个 大 型 系统 应 该 被 组 织 成 数 百 个 如 上 所 述 的 小 结构 。 这 种 组 织 应 该 是 有 层次 的 : 主要 的 子 
系统 应 该 实现 为 结构 ， 其 中 的 组 件 是 更 为 下 层 结构 。 比 较 混 乱 的 程序 员 可 能 会 发 现 自己 在 管 
辖 着 几 个 巨型 结构 ， 每 个 结构 都 是 由 成 百 上 千 的 组 件 组 成 的 。 

组 织 得 好 的 系统 会 有 许多 小 的 签名 。 组 件 的 描述 将 遵守 严格 的 命名 约定 。 在 小 组 项 目 中 ， 
组 员 必须 在 每 个 签名 上 取得 一 致 ， 之 后 对 于 签名 的 改动 一 定 要 严格 控制 。 

系统 将 包括 一 些 ， 也 可 能 是 很 多 的 函 子 。 如 果 主 要 的 子 系 统 都 是 独立 实现 的 ， 那 么 它们 
就 都 必须 是 函 子 。 

模块 语言 包含 了 使 所 有 这 些 行 之 有 效 的 做 法 成 为 可 能 的 构造 ， 其 中 许多 构造 是 星 滁 的 ， 
因此 让 我 们 更 近 一 步 地 看 看 模块 。 


7.11 多 参数 函 子 


一 个 ML 函数 只 有 一 个 参数 。 多 个 参数 通常 包装 成 一 个 元 组 。 另 外 ， 它 们 也 可 以 包装 成 一 
个 记录 。 高 阶 函数 可 以 通过 柯 里 化 的 机 制 来 表示 多 个 参数 。 
一 个 函 子 也 只 有 一 个 参数 。 多 个 参数 包装 成 为 一 个 结构 ， 这 和 将 函数 的 参数 作为 记录 传 
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ML 进行 了 扩展 ， 高 阶 函 子 人 允许 柯 里 化 。 

字典 顺序 光子。 第 一 个 例子 是 带 两 个 参数 的 函 子 。 若 < 是 类 型 a 上 的 序 关系 ， 并 且 <p 是 类 
型 B 上 的 序 关系 ， 则 类 型 a x Bp 上 的 字典 序 (lexicographic ordering) <。.p 定 义 为 


(a', b') <axp (a,b) 当 且 仅 当 a'<o。a 或 (a'=a 且 b'<pb) 
鸭子 LexOrder 的 结果 签名 是 ORDER。 它 需要 两 个 形式 参数 : 结构 01 和 0O2， 也 都 具有 签名 
ORDER。 该 函 子 的 声明 说 明了 ML 函 子 头 的 一 般 语法 : 
functor LexOrder (structure Oi: ORDER 


structure 02: ORDER) : ORDER = 
struct 


type t = Ol.t * O2.t; 
fun compare ((xl,yl), (x2,y2)) = 
(case Ol.compare (x1,x2) of 
EQUAL => O2.compare (y1,y2) 
| ord => ord) 
end; 


形式 参数 表 就 是 一 个 签名 描述 一 一 没有 括 住 两 端的 sig 和 end 的 一 个 签名 。 被 描述 的 组 件 在 函 
子 体 中 是 可 见 的 。 这 个 沙子 可 以 应 用 到 任何 匹配 该 描述 的 结构 上 : 任何 含有 两 个 子 结构 的 结 
构 ， 这 两 个 子 结构 需 匹配 签名 ORDER。 作 为 参数 的 结构 可 以 通过 任何 结构 表达 式 给 出 ， 也 包 
括 函 子 应 用 。 

之 前 声明 过 结构 StringOrder， 也 可 以 类 似 地 声明 结构 IntegerOrder。 我 们 可 以 提供 这 两 个 
结构 给 函 子 : 


structure StringIntOrd = LexOrder(structure O1=StringOrder 


structure O2=integerOrder) ; 
> structure StringIntOrd : ORDER 


由 声明 列表 组 成 的 实际 参数 被 看 作 是 一 个 结构 表达 式 。 这 多 个 参数 (声明 ) 构成 了 结构 体 ， 
并 且 我 们 可 以 省 略 括 住 两 端的 struct 和 end。 

下 面 的 演示 将 提醒 我 们 这 个 函 子 的 目的 。 将 字符 串 的 序 关系 和 整数 的 序 关 系 组 合 在 一 起 
产生 了 序 偶 (字符 串 ， 整 数 ) 上 的 序 关系 。 字 符 串 上 的 序 优先 于 整数 上 的 。 


StringIntOrd .compare (({"Edward", 3), ("Henry", 2)); 
> LESS : order 

StringintOrd.compare (("Henry", 6), ("Henry", 6)); 
> EQUAL : order 

StringIntOrd .compare (("Henry", 6), ("Henry", 5)); 


> GREATER : order 


关联 表 ，eqtype 描 述 。ML 关 于 多 个 参数 的 函 子 语法 并 不 要 求 那些 参数 一 定 是 结构 。 它 
们 可 以 是 签名 中 所 能 够 描述 的 任何 东西 ， 包 括 类 型 、 值 和 异常 。 

接 下 来 的 例子 演示 了 eqtype 描 述 ， 以 及 一 般 的 函 子 语法 。 之 前 ， 我 们 已 经 用 二 又 搜 索 树 
实现 过 字典 ， 序 偶 表 简 单 些 ， 但 比较 慢 。 和 3.16 节 中 的 一 样 ， 这 里 查找 操作 使 用 相等 测试 来 
比较 键 值 。 

eqtype 描 述 可 以 出 现在 任何 一 个 签名 中 ， 它 描述 了 允许 相等 测试 的 类 型 。 一 个 结构 只 有 
声明 了 真正 允许 相等 测试 的 类 型 才能 匹配 这 样 的 签名 。 在 函 子 体 中 ， 可 以 在 用 eqtype 描 述 的 
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类 型 上 进行 相等 测试 。 

在 例子 中 ， 函 子 的 形式 参数 表 是 一 个 签名 描述 ( 见 图 7-3)。 里 面 只 有 一 个 参数 ， 也 就 是 
一 个 相等 类 型 。 一 般 的 函 子 语法 允许 我 们 将 4ssocList 看 作 是 一 个 形式 参数 为 一 个 类 型 的 函 子 。 
因为 类 型 key 被 描述 为 eqtype， 所 以 它 允 许 在 4ssocList 内 进行 相等 测试 。 下 面 是 两 个 函 子 的 
应 用 : 

structure StringIntAList = AssocList (type key = string*int) ; 

> structure StringIntAList : DICTIONARY 


structure FunctionAList = AssocList (type key = int->int) ; 
> Error: type key must be an equality type 


可 以 将 图 子 应 用 到 string x int LEA ALTREC S MIR, KWin incl] IBA T 


functor AssocList (eqtype key) : DICTIONARY = 
struct 


type key = key; 
type ‘a t = (key * ‘a) list; 


exception E of key; 
val empty = []; 


lookup ((a,x)::pairs, b) = if a=b then x 
else lookup (pairs, b) 
lookup ([], b) = raise E b; 


insert ((a,x)::pairs, b, y) = if a=b then raise E b 
else (a,x): :insert(pairs, b, y) 
insert ([], 6, y) = [(b,y)]; 


update (pairs, b, y) = (b,y)::pairs; 





图 7-3 使 用 关联 表 的 字典 函 子 
ERKAT. Zik (empty structure) 没有 任何 组 件 : 


struct end 
它 的 签名 是 空 签名 (empty signature): 

sig end 
空 结构 主要 用 作 函 子 的 实际 参数 。 这 类 似 于 空 元 组 0， 它 主要 在 函数 不 依赖 其 参数 值 时 使 用 。 
可 以 回忆 一 下 如 何 使 用 函数 来 表示 序列 尾 (5.12 节 )。 空 参数 也 和 命令 式 程 序 设计 一 起 使 用 。 
这 里 ， 函 子 的 例子 涉及 到 了 引用 ， 我 们 将 在 第 8 章 进行 讨论 。 

函 子 MakecCceli 带 有 一 个 空 参数 。 它 的 空 形 式 参数 表 构 成 了 一 个 空 签 名 。 每 次 调用 
MakeCell 时 ， 它 都 分 配 了 一 个 新 的 引用 单元 ， 并 将 其 作为 结构 的 一 部 分 返回 。 一 开始 这 个 单 
元 等 于 0: | 


functor MakeCell () = struct val cell = ref 0 end; 
> functor MakeCell : <sig> 
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下 面 是 两 个 消 子 调用 。 空 的 实际 参数 表 构 成 了 空 结构 体 。 


structure Cl = MakeCell () 


and C2 = MakeCell (); 
> structure Cl : sig val cell : int ref end 
> structure C2 : sig val cell : int ref end 


结构 C1 和 C2 是 以 同样 方式 创建 的 ， 但 是 它们 包含 了 不 同 的 引用 单元 。 我 们 将 1 存 入 C1 单 元 ， 
然后 查看 它们 两 个 的 情况 : 


Cl.cell := 1; 

> () : unit 
Cl.cell; 

> ref 1: int ref 
C2.cell; 


> ref 0 : int ref 


两 个 单元 存 有 不 同 的 整数 。 因 为 MakeCell 是 芳子 而 不 是 结构 ， 所 以 它 能 够 需要 多 少 不 同 的 单 
元 就 分 配 多 少 。 


A 画 子 语法 的 混淆 。 一 般 函 子 语法 都 在 孙子 头 中 放置 一 个 签名 描述 ， 由 此 可 以 处 
理 任意 数量 的 参数 。 但 是 ， 当 恰好 只 有 一 个 结构 作为 参数 时 又 怎样 呢 ? 我 们 可 以 使 
用 基本 池子 语法 ， 它 比 一 般 语 法 更 为 简练 直接 ， 一般 语 法 需要 建立 另 一 个 结构 。 另 
一 方面 ， 同 时 在 一 个 程序 中 使 用 两 种 语法 又 可 能 导致 混 消 。 我 们 早期 的 所 有 例子 都 
使 用 基本 语法 : 

functor TestQueue (Q: QUEUE) ... 

另外 一 个 程序 员 有 可 能 已 经 使 用 了 一 般 语法 : 

functor TestQueue2 (structure Q: QUEUE) ... 


这 两 个 声明 的 区 别 仅 在 于 形式 参数 表 中 关键 字 Structure， 有 可 能 被 忽视 。 要 想 避 
免 错误 信息 ， 函 子 需 要 以 相应 的 参数 语法 来 调用 : 

TestQueue  (Queue3) 

TestQueue2 (structure Q = Queue3) 


为 统一 起 见 ， 有些 程 序 员 倾向 于 只 使 用 一 般 语 法 。 


练习 7.21 书写 另 一 版 本 的 AssocList， 其 中 不 涉及 eqtype。 而 使 用 类 似 ORDER 的 签名 取 而 
代 之 。 

练习 7.22 浮子 AssocList 并 未 隐藏 字典 的 表示 方法 ， 书 写 另 一 版 本 ， 在 其 中 声明 一 个 抽象 
类 型 。 

练习 7.23 在 偏 序 关 系 中 ， 有 些 元 素 对 可 以 是 不 相关 的 。 将 这 种 情况 记 为 EQUAL 通 常 都 不 会 
令 人 满意 ， 这 样 做 在 字典 序 的 定义 中 会 给 出 错误 的 结果 。John Reppy 建 议 用 类 型 order option 
的 值 来 表示 比较 结果 ， 使 用 NONE 来 标记 “无 关系 ”。 请 仿照 ORDER 和 LexOrder 为 偏 序 声明 签 
名 PORDER， 并 声明 用 于 组 合 偏 序 关 系 的 函 子 LexPOrder。 


练习 7.24 (继续 上 面 的 练习 。) 若 a 是 一 类 型 ，<p 是 类 型 6 上 的 偏 序 关系 ， 并 且 f 是 具有 类 型 
Qa 一 的 函数 ， 则 可 以 定义 类 型 a 上 的 偏 序 关 系 < ,满足 x' < x 当 且 仅 当 f(x') <p f(x)。( 注 意 ， 
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f(x') =f(x) 并 不 需要 前 涵 x' = x。) 请 声明 一 个 三 参数 函 子 来 实现 这 个 定义 。 


练习 7.25 ”哪些 结构 是 空 签名 的 实例 ? 换 名 话说， 哪些 结构 可 以 作为 国 子 MakeCe1 的 合法 
参数 ? 


7.12 共享 约束 


当 模 块 被 组 合 在 一 起 形成 更 大 的 模块 时 ， 需 要 特别 小 心地 去 保证 各 组 件 彼 此 配合 。 考 虑 
将 字典 和 优先 队列 组 合 在 一 起 的 疝 题 ， 这 时 要 保证 它们 的 类 型 是 一 致 的 。 

上 上面， 我 们 将 国 子 Dictrionary 应 用 到 参数 StringOrder 上 ， 创 建 了 结构 StringPDict。 接 着 ， 我 
们 把 dict 声 明 为 一 个 以 字符 串 为 索引 的 字典 。 类 似 地 ， 我 们 可 以 将 PriorityCuexe 应 用 到 
StringOrder 上、 并 创建 字符 串 的 优先 队列 结构 。 


structure StringPQueue = PriorityQueue (StringOrder) ; 
> structure StringPQueue : PRIORITY_QUEUE 


现在 我 们 来 将 pg 声明 为 字符 串 的 优先 队列 : 

StringPQueue .insert("Agincourt", StringPQueue . empty) ; 

> - ; StringPQueue.t 

StringPQueue .insert("Crecy", it); 

> - : StringPQueue.t 

val pq = StringPQueue.insert("Poitiers", it); 

> val pq = -.: StringPQueue.t 
由 于 pq 中 的 元 素 是 字符 串 ， 并 且 dic! 是 以 字符 串 为 索引 ， 因 此 p9 的 最 小 元 可 以 作为 搜索 dict 的 
键 值 。 

StringDict . lookup (dict, StringPQueue.min pq) ; 

> 1415 : int 
我 们 已 经 把 字典 和 优先 队列 放 在 一 起 使 用 了 ， 不 过 只 是 针对 类 型 string。 将 上 面 这 个 表达 式 推 
广 到 任意 的 有 序 类 型 则 需要 一 个 芳子 。 在 函 子 体 中 ， 表 达 式 形 如 


Dict . lookup (dict, PQueue.min pq) 


其 中 ，PQueue 和 Dict 是 分 别 匹配 签名 PRIORITY_QUEUE 和 DICTIONARY 的 结构 。 但 是 ， 里 面 
的 类 型 一 致 吗 ? 


PQueue.min : PQueue.t — PQueue.Item.t 


Dict.lookup : a Dict.t x Dict.key > a 


对 于 Dict.lookup 的 调用 只 有 在 PQueue.Item.t 和 Dict.key 是 同 种 类 型 时 才 是 允许 的 。 保 证 这 点 的 
一 个 办 法 是 让 函 子 自行 建立 结构 PQueune 和 Dict。 下 面 的 函 子 以 一 个 有 序 类 型 作为 参数 ， 并 把 
它 提供 给 函 子 PriorityQueue 和 Dictionary。 上 面 的 表达 式 将 作为 函数 lookmin 的 函数 体 出 现 。 


functor Joinl (Order: ORDER) = 
struct 


structure PQueue = PriorityQueue (Order) ; 
structure Dict = Dictionary (Order) ; 


fun lookmin(dict, pq) = Dict.lookup(dict, PQueue.min pq); ‘ 


end; 
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通常 都 会 用 到 一 个 函 子 调用 另 一 个 浪子 。 但 是 ， 函 子 Join1 并 没有 组 合 现 有 的 结构 : 它 创建 了 
新 的 结构 。 这 种 做 法 会 创建 很 多 重复 的 结构 。 

我 们 的 函 子 应 该 采用 现 有 的 结构 PQueue 和 Dict， 检 查 它们 的 类 型 是 否 兼 容 。 共 享 约束 
(sharing constraint) 能 够 强制 类 型 一 致 : 

functor Join2 (structure PQueue : PRIORITY_QUEUE 


structure Dict : DICTIONARY 


sharing type PQueue.ltem.t = Dict.key) = 
struct 


fun lookmin (dict, pq) = Dict.lookup (dict, PQueue.min pq) ; 
end; 
RNABTSZSRAFAK, AAKSOREE HRN ABR. EATEN, BOR 
保 了 那 两 个 类 型 是 相等 的 ， 因 此 、 类 型 检测 器 会 接受 lookmin 的 声明 。 当 函 子 应 用 到 实际 的 结 
构 上 时 ，ML 编 译 器 将 要 求 那 两 个 类 型 确实 是 一 样 的 。 
为 了 演示 这 个 函 子 ， 我 们 需要 整数 类 型 的 优先 队列 和 字典 : 
structure IntegerPQueue = PriorityQueue (IntegerOrder) ; 
> structure IntegerPQueue : PRIORITY_QUEUE 


structure IntegerDict = Dictionary (IntegerOrder) ; 
> structure IntegerDict : DICTIONARY 


两 个 基于 字符 串 的 结构 可 以 组 合 在 一 起 ， 两 个 基于 整数 的 结构 也 可 以 。 在 两 种 情形 中 ， 函 数 
lookmin 采 用 了 基于 相同 类 型 的 优先 队列 和 字典 。 


structure StringCom = Join2 (structure PQueue 


= StringPQueue 
structure Dict = StringDict) ; 
> structure StringCom 
> : sig 
> val lookmin: ‘a StringDict.t * StringPQueue.t -> ‘a 
> end 
structure IntegerCom = Join2 (structure PQueue = IntegerPQueue 
structure Dict = IntegerDict) ; 
> structure IntegerCom 
> : sig 
> val lookmin: ‘a IntegerDict.t * IntegerPQueue.t -> ‘a 
> end 


但 是 ， 如 果 我 们 试图 混合 两 种 类 型 的 话 ， 编 译 器 会 拒绝 这 个 声明 : 


structure Bad = Join2 (structure PQueue = 
structure Dict = 

> Error: type sharing violation 

> StringDict.key # IntegerPQueue.Item.t 


结构 上 的 共享 约束 。 当 国 子 组 合 系统 组 件 时 ， 其 
中 的 公共 子 结构 可 能 需要 共享 约束 。 下 面 画 的 是 一 个 
典型 的 情况 。 结 构 In 输 入 待 解 的 问题 ， 结 构 Oui 输 出 
问题 的 解 。 这 两 个 组 件 通 过 一 个 目标 问题 的 优先 队列 
进行 通信 ， 这 个 优先 队列 在 结构 PQueue 中 。 结 构 
Main 通 过 In 和 Oui 协 调 这 个 程序 。 


IntegerPQueue 
StringDict) ; 
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假设 Ix 和 Ou 匹配 下 面 的 两 个 签名 : 


signature IN = 
sig 
structure PQueue: PRIORITY-QUEUE 
type problem 
val goals: problem -> PQueue.t 
end; 

signature OUT = 
sig 
structure PQueue: PRIORITY_QUEUE 
type solution 
val solve: PQueue.t -> solution 
end; 


Hen Fl Ourkh A ERER PAF KBE IK EH: 


functor MainFunctor (structure In: IN and Out: OUT 
sharing In.PQueue = Out.PQueue) = 
struct 
fun tackle(p) = Out.solve(In.goals p) 
end; 


因为 结构 证 .POxerke 和 Our.POrvexe 是 声明 为 共享 的 ， 所 以 类 型 .PCuexe.t 和 Our.PCuere.! 在 图 
子 体 内 是 相同 的 。( 留意 and 的 使 用 ， 它 可 以 简洁 地 描述 两 个 结构 。) 

在 构造 系统 的 上 时候， 需要 将 同一 个 结构 PQueue 放 到 In 和 Out 中 去 。 然 后 ， 印 子 
MainFunctor 就 会 接受 In 和 Oui 作 为 参数 ， 因 为 它们 会 满足 共享 约束 。 

理解 共享 约束 。 共 享 是 ML 模块 中 最 难 的 方面 之 一 。 虽 然 共 享 约束 可 以 出 现在 任何 签名 中 ， 
但 是 它们 仅 在 签名 是 描述 函 子 参数 时 才 是 必需 的 。 使 用 的 函 子 越 多 ， 需 要 的 共享 约束 越 多 。 

类 型 错误 通常 是 警告 哪里 可 能 需要 一 个 共享 约束 。 在 上 一 个 例子 中 ， 省 略 共享 约束 可 能 
导致 错误 “类 型 冲突 : 期 望 In.PQueue.t， 发 现 Out.PQueue.t。” 不 幸 的 是 ， 有 些 编译 器 会 产生 
莫名 其 妙 的 错误 信息 。 

类 型 错误 可 以 通过 在 类 型 上 强加 一 个 共享 约束 来 避免 : 


sharing type /n.PQueue.t = Out.PQueue.t 


实际 用 于 MainFunctor 中 的 结构 共享 约束 要 更 强 些 : 它 蕴 涵 的 类 型 共享 是 一 直 进 行 到 底 的 。 它 
萤 涵 的 类 型 In.POueue.Item.t 和 Out.PQueue.ltem.t 也 是 共享 的 。 

ML 通过 比较 类 型 的 独立 标识 来 强制 共享 约束 。 每 个 新 的 数据 类 型 和 抽象 类 型 都 被 认为 和 
之 前 所 有 的 已 有 类 型 不 同 。 

structure DTI = struct datatype t = C end; 

structure DT2 = struct datatype t = C end; 

structure DT3 = struct type t = DTl.t end; 
类 型 DT71.! 和 D72.! 是 不 同 的 ， 尽 管 它们 来 自 完全 相同 的 datatypPe 声 明 。 类 型 缩写 保持 了 类 型 
的 独立 标识 ， 因 此 类 型 DT1.t 和 DT3.t 是 一 样 的 。 


练习 7.26 解释 ML 对 于 下 列 声明 的 回应 。 


signature TYPE = sig type t end; 
functor Funny (structure A: TYPE and B: TYPE 
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sharing A=B) = A; 
structure Sl = Funny (structure A=DT1 and B=DT)); 
structure $2 = Funny (structure A=DT2 and B=DT2); 
structure $3 = Funny (structure A=Si and B=§2); 


练习 7.27 假设 函 子 input 和 Output 是 如 下 声明 的 : 


functor Input (structure PQueue: PRIORITY_QUEUE): IN = 
struct 
structure PQueue = PQueue; 
fun goals ...; 
end; 


functor Output (structure PQueue: PRIORITY_.QUEUE): OUT = 
struct 


structure PQueue = PQueue; 

fun solve ...; 

end; 
RAMANA 2% oa KE REA MainFunctorHay. Bia, PWRAMRE AERA 
子 共享 约束 的 结构 。 


练习 7.28 ”上面 声 明 的 函 子 Input 和 Output 将 形式 参数 POueue 合 并 到 了 结果 结构 中 。 修 改 它们 
以 生成 全 新 的 PRIORITY_QUEUE 的 实例 。 这 样 将 会 如 何 影响 MainFunctor? 


7.13 全 画 子 式 程序 设计 


不 言 而 喻 ， 不 应 该 声明 一 个 只 调用 一 次 的 过 程 。 我 们 并 未 声明 过 只 调用 一 次 的 沙子。 每 
个 形式 参数 都 可 以 在 实际 参数 中 进行 选择 ， 例 如 ， 参 数 Order 可 以 被 实例 化 成 StringOrder 或 
IntegerOrder。 非 泛 型 的 程序 单元 则 被 编写 成 结构 、 而 不 是 写成 函 子 。 

然而 ， 声 明 过 程 现 在 被 看 作 是 良好 的 编程 方式 ， 即 使 它们 仅 被 调用 一 次 。 有 很 好 的 理由 
去 声明 那些 不 仅仅 是 必需 的 函 子 。 有 些 程序 员 几 乎 完全 使 用 函 子 编写 程序 ， 只 是 在 给 函 子 提 
供 参数 时 才 书 写 结构 。 他 们 的 函 子 和 签名 是 自 包含 的 : 只 引用 其 他 签名 以 及 标准 库 的 组 件 。 

如 果 所 有 的 程序 单元 都 编写 成 函 子 ， 那 么 就 可 以 单独 书写 和 编译 它们 。 首 先 ， 声 明 签名 ， 
然后 编写 函 子 。 当 编译 函 子 时 ， 错 误 信 息 可 以 揭示 签名 中 的 缺失 和 错误 。 修 正 后 的 签名 可 以 
通过 重新 编译 函 子 来 检查 。 

留 子 可 以 以 任意 顺序 进行 编写 。 每 个 函 子 只 引用 签名 ， 而 不 是 结构 或 其 他 甸 子 。 一些 人 
喜欢 自 顶 向 下 编写 ， 另 一 些 则 是 自 底 向 上 。 多 个 程序 员 可 以 独立 地 编写 他 们 的 沙子 。 

一 旦 所 有 的 函 子 书写 和 编译 完毕 ， 应 用 它们 就 能 为 每 个 程序 单元 生成 一 个 结构 。 最 后 的 
结构 包含 了 可 执行 程序 。 一 个 函 子 可 以 被 修改 和 重新 编译 ， 然 后 新 的 系统 得 以 建立 ， 如 果 签 
名 没有 改动 ， 则 不 需要 重新 编译 其 他 函 子 。 应 用 函 子 相当 于 链接 程序 单元 。 可 以 为 系统 建立 
不 同 的 配置 。 

二 又 树 函 于。 从 4.13 节 开始 ， 我 们 陆续 声明 了 二 又 树 、 弹 性 数组 等 结构 。 我 们 甚至 将 tree 
声明 为 顶层 的 数据 类 型 。 爹 函 子 方式 要 求 每 个 程序 单元 都 由 一 个 自 包 含 的 签名 来 描述 。 

我 们 现在 必须 为 二 叉 树 声明 一 个 签名 。 签 名 中 必须 描述 数据 类 型 tree， 因 为 它 将 不 在 顶层 
声明 。 
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signature TREE = 


sig 

datatype ‘a tree = Lf | Br of ‘a * 'a tree * ‘a tree 
val size : ‘a tree -> int 

val depth : ‘a tree -> int 


val reflect : ‘a tree -> ‘a tree 


end; 


我 们 必须 为 Braun 数 组 的 操作 声明 一 个 签名 。 这 个 签名 将 Tree 描 述 为 一 个 子 结构 以 提供 对 于 类 


型 tree 的 访问 。。 


signature BRAUN = 


sig 

structure Tree: TREE 

val sub : ‘a Tree.tree * int -> ‘a 

val update : ‘a Tree.tree * int * 'a -> ‘a Tree.tree 
val delete : ‘a Tree.tree * int -> ‘a Tree .tree 
end; 


签名 FLEXARRAY (4.1547) 是 自 包含 的 ， 因 为 它 只 依赖 于 标准 类 型 inr。 签 名 ORDER 和 
PRIORITY_QUEUE (7.10 节 ) 也 是 自 包含 的 。 由 于 一 个 签名 可 能 引用 其 他 签名 ， 因 此 必须 以 正 
确 的 顺序 进行 声明 : TREE 必 须 在 BRAUN 之 前 声明 ，ORDER 要 在 PRIORITY_QUEUE 之 前 声明 。 

由 于 我 们 的 函 子 并 不 互相 引用 ， 因 此 它们 可 以 以 任意 师 序 声明 。 现 在 可 以 立即 声明 国 子 
PriorityQueue ， 即 使 它 的 实现 依赖 于 二 又 树 。 这 个 函 子 是 自 包 含 的 : 它 以 一 个 二 叉 树 结构 Tree 


作为 形式 参数 ， 并 通过 使 用 它 来 访问 树 的 操作 : 
functor PriorityQueue (structure Item : ORDER 


structure Tree : TREE) 
: PRIORITY_QUEUE = - 


abstype t = PO of Item.t Tree.tree 


结构 Fiex (参见 图 4-3) WEAR ABT FlexArray, Kp Braun H CHERS. xt 
图 子 体 类 似 于 原来 的 结构 声明 ， 但 是 树 的 操作 现在 变 为 子 结构 Brarr.T7ee 的 组 件 了 。 


functor FlexArray (Braun: BRAUN) : FLEXARRAY = 


val empty = Array (Braun .Tree.Lf, 0) ; 


££ fy Braun th, Hy Le ae Ee ea F BraunFunctor, KPR Treep H CHICKA R. 


functor BraunFunctor (Tree: TREE) : BRAUN = ... 


O 也 可 以 直接 描述 类 型 tee， 见 7.15 节 。 
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甚至 结构 Tree 也 可 以 改 为 函 子 ， 它 具有 空 参数 ， 
296 functor TreeFunctor () : TREE = struct ... end; 
现在 ， 所 有 的 图 子 都 已 声明 。 
将 济 子 链接 在 一 起 。 在 最 后 阶段 ， 当 所 有 代码 都 书写 完毕 后 ， 就 轮 到 应 用 函 子 了。 每 个 
结构 都 是 通过 将 一 个 函 子 应 用 到 已 创建 的 结构 上 而 建立 的 。 一 开始 ， 将 TreeFunctor 应 用 到 一 
个 空 参数 表 上 来 生成 结构 Tree。 


structure Tree = TreeFunctor (); 
> structure Tree : TREE 


图 子 应 用 创建 了 结构 Braxm 和 Flex: 


structure Braun = BraunFunctor (Tree) ; 
structure Flex = FlexArray (Braun) ; 


如 前 面 那样 声明 结构 StringOrder: 
structure StringOrder = ... ; 
现在 ， 像 前 面 一 样 ， 可 以 通过 图 子 应 用 声明 结构 StringPOuere: 


structure StringPQueue = 
PriorityQueue (structure Item = StringOrder 
structure Tree = Tree); 


图 7-4 描 绘 了 完整 的 系统 ， 其 中 结构 在 弧 形 框 中 ， 函 子 在 长 方形 框 中 。 大 多 数 结构 都 是 由 函 子 
创建 的 ， 只 有 StringOrder 是 直接 书写 的 。 





图 7-4 涉及 树 的 结构 和 函 子 
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& AFAR RA. BA ABE a HE RETR, REM Ee 
名 字 都 有 点 困难 。 共 享 约束 成 倍 地 增加 。 如 果 我 们 将 这 个 例子 继续 下 去 的 话 ， 可 以 预见 会 需 
要 很 多 的 共享 约束 来 保证 这 些 结 构 共 享 相 同 的 子 结构 Tree。 对 于 某 些 ML 系 统 ， 编 译 出 来 的 代 
码 可 能 是 应 有 的 两 倍 大 ， 因 为 同样 的 代码 既 存 在 于 函 子 中 也 存在 于 结构 中 。 

比较 好 的 折 中 方法 是 对 主要 的 程序 单元 使 用 国 子 : 也 就 是 那些 必须 独立 编写 的 部 分 。 无 
论 如 何 ， 这 些 部 分 大 都 是 泛 型 的 。 下 层 的 单元 可 以 声明 为 结构 。Biagioni 等 (1994) 曾经 用 签 
名 和 国 子 将 一 个 大 型 网 络 系统 的 各 个 层次 组 织 起 来 ， 组 件 可 以 以 多 种 方式 连 在 一 起 来 满足 各 
种 特殊 的 要 求 。 





a 何 时 签名 是 自 包含 的 ? 由 一 个 描述 引进 的 名 字 在 签名 的 余下 部 分 是 可 见 的 。 签 
名 TREE 描述 了 类 型 ee， 然 后 使 用 它 以 及 类 型 int 来 描述 size 的 类 型 。 预 定义 的 名 字 ， 
像 int 和 标准 库 结构 ， 被 称 为 普遍 的 (pervasive): 它们 到 处 可 见 。 一 个 名 字 如 果 出 现 
在 签名 中 ， 而 又 没有 对 其 进行 描述 ， 那 么 这 个 名 字 就 称 为 在 签名 中 是 自由 的 〈free )。 
在 TREE 中 唯一 自由 出 现 的 名 字 是 int。 

David MacQueen X Standard ML 模块 (Harper 等 ，1986) 写 了 最 初 的 计划 书 。 他 
建议 签名 不 能 引用 程序 在 其 他 地 方 声 明 的 名 字 ， 除 非 这 个 名 字 代 表 另 一 个 签名 。 签 
名 可 以 引用 在 同一 签名 内 描述 的 结构 ， 但 不 能 引用 自由 出 现 的 结构 。 这 样 一 来 ， 所 
有 的 签名 都 是 自 包含 的 了 ， 并 且 所 有 结构 都 包含 了 它 所 依赖 的 结构 和 类 型 。 这 个 限 
制 ， 称 为 签名 闭合 规则 〈signature closure rule )， 最 终 被 放宽 了 ， 以 给 予 程序 员 更 大 
的 自由 。 

在 爹 剖 子 方式 中 ， 结 构 是 最 后 声明 的 。 签 名 自然 而 然 地 遵守 签名 闭合 规则 ， 因 
为 不 存在 它们 可 以 引用 的 结构 。 在 BRAUN 中 唯一 自由 的 名 字 是 普遍 的 类 型 int 和 签名 
TREE。 如 果 


structure Tree : TREE 


这 一 行 被 去 掉 的 话 ， 签 名 就 要 依赖 某 个 已 经 声明 了 的 结构 Tree， 因 为 签名 在 涵 数 的 类 
型 里 提 到 了 Tree.tree。 这 是 一 种 可 以 接受 的 程序 设计 方式 ， 但 它 不 是 全 男子 方式 ， 并 
且 它 也 违反 了 签名 闭合 规则 。 


涵 子 和 签名 约束 。 在 全 隙 子 方式 的 程序 设计 中 ， 每 个 孙子 只 是 通过 形式 参数 来 
引用 结构 。 除 了 参数 结构 的 签名 外 ， 雯 子 对 其 一 无 所 知 。 就 像 给 予 实际 结构 一 个 不 
REL MRK, 

假设 函 子 的 形式 参数 包括 了 具有 签名 DICTION4RY 的 结构 Dict。 在 函 子 体内 ， 类 
型 a Dictt 看 上 去 就 像 一 个 抽象 类 型 : 它 没 有 可 以 用 于 模式 匹配 的 构造 子 ， 并 且 相等 
测试 也 被 禁止 了 。 类 型 Dict.key 也 是 类 似 的 抽象 ， 除 非 有 一 个 共享 约束 将 它 等 同 于 另 
外 某 个 类 型 ， 否 则 我 们 将 无 法 调用 Dict.lookup。 


练习 7.29 ”书写 一 个 无 参数 函 子 ， 使 其 结果 签名 为 QUEUE， 要 求 函 子 实现 队列 的 表示 法 3。 
练习 7.30 为 惰性 表 的 抽象 类 型 描述 一 个 签名 SEQUENCE， 并 通过 书写 结果 签名 为 
SEQUENCE 的 尔 子 来 实现 这 个 类 型 。 书 写 一 个 函 子 ， 以 QUEUE 和 SEQUENCE 的 实例 为 参数 ， 
并 声明 像 depthFirst 和 breadthFirst (5.17 节 ) 这 样 的 函数 。 
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437.31 列 出 在 以 下 签名 中 自由 出 现 的 名 字 : QUEUE], QUEUE2, QUEUE3, DICTIONARY 
(4.14 节 ) 和 FLEXARRAY (4.15 节 )。 


7.14 open 声 阴 


当 结构 钳 套 的 时 候 ， 复 合 名 字 会 有 麻烦 。 在 冰 子 Fiex4rray 体 内 ， 二 又 树 类 型 被 称 为 
Braun.Tree.tree ， 它 的 构造 子 叫做 Braun.Tree.Lf 和 Braun.Tree.Br。 类 型 及 其 构造 子 的 作用 没有 
变化 ， 但 是 使 用 这 种 构造 子 记 法 书写 的 模式 很 可 能 难以 阅读 。 

尽管 全 函 子 方式 令 这 个 问题 变 得 更 糟 了 ， 不 过 任何 大 程序 中 都 会 出 现 长 的 复合 名 字 。 幸 
好 ， 有 许多 方法 来 缩写 这 样 的 名 字 。 

打开 (open) 结构 将 声明 其 中 的 项 ， 使 得 它们 可 以 通过 简单 名 字 使 用 。open 声 明 的 语 
法 是 

open Id 
其 中 1 是 结构 的 名 字 (有 可 能 是 复合 的 )。 一 次 只 打开 一 层 结构 。 在 声明 


open Braun; 


之 后 ， 我 们 可 以 书写 Tree 和 Tree.Lf， 而 不 是 Braun.Tree 和 Braun.Tree.Lf。 如 果 我 们 继续 声明 


open Tree; 


则 可 以 书写 Lf 和 Br， 而 不 是 Tree.Lf 和 Tree.Br。 在 这 个 open 声 明 的 作用 域内 ，Lf 和 Br 表示 构 
造 子 ， 它 们 不 能 被 作为 值 来 重新 声明 。 

局 部 open 上 声明 。 由 于 open 是 一 个 声明 ，1let 或 1ocal 构 造 可 以 用 来 限制 它 的 作用 域 。 
回忆 一 下 ，let 使 得 声明 私有 于 一 个 表达 式 ， 而 local 则 使 得 声明 私有 于 另 一 个 声明 。 

下 面 是 局 部 open 声 明 的 一 个 例子 ， 它 同时 演示 了 open 会 被 怎样 地 误 用 。 国 子 Fiex4rray 
可 能 会 如 下 使 用 local: 


functor FlexArray (Braun: BRAUN) : FLEXARRAY = 
struct 
local open Braun Braun. Tree 
in 
datatype ’a array = Array of ‘a tree * int; 
val empty = Array(Lf,0); 
fun length (Array(_,n)) = n; 
fun sub . 
fun update ... 
fun delete ... 
fun loext .. 
fun lorem ... 
end 
end; 


open 声 明 使 Braun 和 Braun.Tree 的 组 件 可 见 ,而 1ocal 声 明 则 将 它们 的 作用 域 限制 在 芳子 体内 。 
我 们 不 再 需要 书写 复合 名 字 了 。 

真 不 需要 吗 ? 回想 一 下 ， 这 个 函 子 是 基于 Braun 数 组 来 实现 弹性 数组 的 。 弹 性 数组 的 下 标 
操作 使 用 了 Braun 数 组 的 下 标 操 作 。 两 个 操作 都 叫做 sub， 为 了 避免 名 字 冲 突 ， 必 须 书写 一 个 
复合 名 字 : 
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fun sub (Array(t,n), k) = 
if 0<=k andalso k<n then Braun. sub(t,k+1) 
else raise Subscript; 


去 掉 上 面 的 前 组 Bratn .会 建立 一 个 不 合 逻 辑 的 sup 递归 调用 ， 以 及 一 个 类 型 错误 。 因 此 打开 
Braun 并 没有 起 到 什么 作用 。 另 外 ， 也 没有 必要 打开 Braun.Tree， 因 为 函 子 体内 只 使 用 了 两 次 
这 个 前 绥 。 

使 用 let 的 结构 表达 式 。 对 于 open 的 应 用 来 说 ，BraunFunctor 是 较 好 的 候选 者 ， 其 中 大 
量 使 用 了 树 的 构造 子 ( 见 图 7-5)。 打 开 结 构 Tree 使 我 们 在 类 似 Br(w, Lf, Lf) 的 表达 式 中 不 用 再 
书写 复合 名 字 了 。 













functor BraunFunctor (Tree: 
let open Tree in 

struct 

structure Tree = Tree; 


: BRAUN = 





TREE) 




















fun sub (Lf, _) 
| sub (Br(v,tl,t2), k) 
if k = 1 then v 

else if k mod 2 = 0 
then sub (tl, k div 2) 
else sub (12, k div 2); 


raise Subscript 


hou 






fun update (Lf, k, w) = 
if k = 1 then Br (w, Lf, Lf) 
else raise Subscript 
| update (Br(v,tl,t2), k, w) = 
if k = 1 then Br (w, tl, t2) 
else if k mod 2 = 0 
then Br (v, update(tl, k div 2, w), t2) 
else Br (v, tl, update(t2?, k div 2, w)); 












fun delete (Lf, n) = 

| delete (Br(v,tl,#2), n) = 
if n = 1 then Lf 

else if n mod 2 = 0 

then Br (v, delete(tl, n div 2), 12) 

else Br (v, tl, delete(t2, n div 2)); 


raise Subscript 


















fun loext (Lf, w) = Br(w, Lf, Lf) 
| loext (Br(v,tl,t2), w) = Br(w, loext(t2,v), tl); 









fun lorem Lf 
| lorem (Br(_,Lf,_)) 
| lorem (Br(_, tl as Briv,_,_), 12)) 


raise Size 
if 
Br(v, 12, lorem tl); 








fou ou 


end 
end; 


图 7-5 pA fAAA let open 例子 
该 函 子 使 用 了 一 种 新 的 Let 构造， 这 个 构造 是 操作 在 结构 上 的 。 假 设 Str 是 需要 用 到 声明 D 
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的 结构 表达 式 ， 那 么 对 结构 表达 式 
let D in Str end 


进行 求 值 将 产生 对 Str 求 值 的 结果 ， 同 时 定义 了 的 作用 域 。 如 果 Str 具 有 形式 struct .… end, 
就 像 BraunFunctor 中 的 那样 ， 那 么 可 以 将 其 等 价 地 写 为 (如 前 面 的 例子 ) 

struct ~ 

local D in ... end 

end 


但 是 ， 我 们 可 以 将 1et 用 在 其 他 的 结构 表达 式 上 ， 例 如 国 子 应 用 。 这 一 点 在 一 个 结构 被 多 次 
使 用 时 特别 有 用 : 


functor QuadOrder (O: ORDER) : ORDER = 
let structure OO = LexOrder (structure Ol 

structure 02 

OO 

00) 


ou 
2 


in LexOrder (structure Ql 
structure 02 


end; 


函 子 QuadOrder 以 一 个 有 序 结 构 为 参数 ， 并 返回 形 如 ((w, x), O, 2) 的 四 元 组 字典 序 结构 。 
在 内 部 建立 了 结构 00，00 定 义 了 序 偶 的 有 序 结构 。 


A 结构 中 的 中 级 操作 符 。 在 结构 中 给 出 的 中 组 命令 对 外 没有 作用 。 当 结构 被 打开 
时 ， 里 面 的 名 字 作为 普通 标识 符 对 外 可 见 ， 而 不 再 被 当 作 中 组 操作 符 ， 要 恢复 它 的 
中 级 状态 需要 新 的 中 级 命令 。 复 合 名 字 永 远 不 能 成 为 中 级 操作 符 ， 只 有 简单 名 字 克 
许 出 现在 中 级 命令 中 。 

在 所 有 结构 之 外 给 出 的 顶层 中 级 命令 具有 全 局 作用 城 。 打 开 一 个 结构 会 绑 定 或 
重新 绑 定 这 些 顶 层 操作 符 。 


ot 


A 合用 open 重 新 绑 定 标识 符 。 打 开 多 个 结构 可 以 一 下 子 声 明 数 以 百 计 的 名 字 。 除 
非 这 些 名 字 的 含义 详细 上 明白， 否则 我 们 可 能 想 不 起 来 它们 属于 哪个 结构 。 使 用 open 
征 盖 已 有 的 绑 定 会 特别 混乱 。 

ML 可 能 会 提供 Real32、Real64、Real96 等 库 结 构 ， 它 们 实现 了 多 种 精度 的 标准 
浮 点 运算 。 这 些 结构 都 匹配 签名 REAL， 里 面 描述 了 类 型 real 以 及 +、 一、x 、/ 等 运 
算 。 

复合 名 字 使 得 这 些 结 构 很 难 使 用 。 下 面 64 位 版 本 的 (ax + x) y 是 很 难看 懂 的 : 
Real64./ (Real64.+ (Real64./(a,x), x), y) 
使 用 一 个 局 部 的 open 声 明 可 以 恢复 可 读 性 : 
let open Real64 in (a/x + x) / y end 


不 不 得 很 ， 打 开 Real64 重 新 声明 了 所 有 的 数值 运算 符 ， 消 除了 对 它们 的 重 载 。 我 们 
不 再 能 书写 像 i+1 这 样 的 整数 表达 式 了 。 整 数 运算 仍旧 可 以 通过 它们 所 在 的 结构 进行 
访问 : 仍 可 书写 Int.+(n, 1)。 但 这 是 一 种 改进 吗 ? 

在 顶层 打开 Real64 绝 对 是 错误 的 。 没 有 任何 办 法 可 以 恢复 重 载 。 像 上 面 那 样 在 小 
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范围 内 打开 Real64 会 比较 好 ， 或 者 声明 新 的 中 级 运算 符 并 将 它们 绕 定 到 相应 的 64 位 
eb, 


open 之 外 的 选择 。 就 像 这 些 例子 所 展示 的 那样 ，open 可 能 导 臻 麻烦。 设计 结构 的 目的 
之 一 是 为 了 利用 复合 名 字 的 长 处 。 项 的 简单 名 字 是 太 短 了 。 像 Braun.sub 和 Flex.sub 这 样 的 复 
合 名 字 不 单 只 是 避免 了 冲突 ， 同 时 它们 也 提供 了 丰富 的 信息 ， 并 强化 了 我 们 对 于 程序 组 织 结 
构 的 了 解 。 
通过 声明 缩写 可 以 缩短 复合 名 字 ， 而 无 须 使 用 open。 我 们 对 于 国 子 Flex4rray 的 声明 可 以 
改进 为 : 
functor FlexArray (Braun: BRAUN) : FLEXARRAY = 
struct 
local structure T = Braun.Tree 
datatype ‘a array = Array of ‘a T.tree * int; 


val empty = Array(T.Lf,0): 
end 


end; 


我 们 声明 了 结构 7 来 对 Braun.Tree 进 行 缩写 ， 以 此 来 代替 打开 这 个 结构 的 做 法 。 虽 然 必须 书写 
Ttree， 但 这 完全 可 以 接受 ， 并 且 用 T.Lf 和 T.Br 所 表示 的 模式 也 是 简洁 的 。 

有 些 程 序 员 会 认为 复合 标识 符 是 不 可 忍受 的 ， 至 少 对 于 那些 大 量 使 用 的 项 来 说 如 此 。 但 
是 ， 当 只 有 其 中 几 项 被 用 到 时 犯 不 着 去 打开 一 个 大 型 模块 。 这 时 ， 一 个 open 声 明 可 以 被 几 个 
单独 的 缩写 替代 : 

type ‘a queue ‘a Queue .t; 


val hd = Queue .hd; 
exception QEmpty = Queue.E; 


最 后 那 行 令 QEmpty 等 同 于 Queue.E， 并 且 它 还 是 一 个 构造 子 ， 甚 至 可 以 出 现在 异常 处 理 器 中 。 
在 上 面 的 异常 绑 定 中 ， 其 右 侧 必须 是 一 个 异常 构造 子 的 名 字 。 

有 选择 地 使 用 open。 在 4.13 节 中 ， 我 们 将 数据 类 型 tree 声 明 在 顶层 ， 以 避免 复合 的 构造 
子 名 字 。 该 方式 并 不 好 ， 所 有 类 型 和 变量 都 应 该 归属 于 某 一 个 结构 。 同 样 ， 我 们 也 不 希望 完 
全 打开 树 结构 。 并 且 ， 也 没有 类 似 异 常 绑 定 的 方法 来 输出 单个 的 数据 类 型 构造 子 。 

我 们 必须 使 用 open， 但 是 可 以 有 选择 地 进行 。 核 心声 明 可 以 声明 在 一 个 子 结构 里 ， 在 本 
例 中 ， 它 们 是 数据 类 型 tree 和 函数 depth。 


structure Tree = 
struct 


structure Export = 
struct 
datatype ‘a tree = Lf 
| Br of ‘a * ‘a tree * ‘a tree; 


fun depth Lf 0 


| depth (Br(v,tl,12)) = 1 + Int.max (depth tl, depth 12); 
end; 
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7# 
open Export; 
fun size Lf =0 
| size (Br(v,tl,t2)) = 1 + size tl + size 12; 
end; 


子 结构 Export 包 含 了 准备 输出 到 顶层 的 项 。 它 立即 就 被 打开 了 ， 是 为 了 将 这 些 项 输出 到 主 结 
构 中 。 以 后 我 们 可 以 输出 这 些 核心 项 ， 同 时 保持 其 他 组 件 只 能 通过 复合 名 字 访 问 : 
open Tree. Export; 
depth Lf; 
> 0: int 
Tree. size Lf; 
> 0 : int 


这 个 思想 的 另 一 个 变种 就 是 在 顶层 声明 核心 项 自己 的 结构 。 它 可 以 称 为 TreeCore， 并 拥有 自 
己 的 签名 TREECORE。 其 他 关于 树 的 结构 和 签名 可 以 引用 这 个 核心 。 
练习 7.32 ”解释 为 什么 StrangePOuere 的 声明 是 有 效 的 。 


functor StrangePQueue () = 
let structure UsedTwice = struct open StringOrder Tree end 
in PriorityQueue (structure Item = UsedTwice 
structure Tree = UsedTwice) 


æ. 


end; 


练习 7.33 下 面 的 声明 有 什么 效果 ? 


open Queue3; open Queue2; 


练习 7.34 下 面 对 于 多 精度 算术 运算 的 尝试 有 什么 错误 ? 


functor MultiplePrecision (F: REAL) = 
struct 
fun half x = F./(x, 2.0) 
end; 


7.15 签名 和 子 结构 


复杂 的 程序 需要 复杂 的 签名 。 当 结构 嵌 套 在 一 起 的 时 候 ， 它 们 的 签名 会 因为 过 长 的 复合 
名 字 而 变 得 混乱 。 假 设 我 们 为 Braun 数 组 的 序 偶 声明 一 个 签名 ， 其 中 描述 了 一 个 匹配 签名 
BRAUN 的 子 结构 : 
signature BRAUNPAIRO = 
sig 
structure Braun: BRAUN 


val zip: ‘a Braun.Tree.tree * 'b Braun.Tree.tree -> 
(‘a*'b) Braun. Tree. tree 


end; 


复合 名 字 写 出 来 的 zip 类 型 变 得 不 可 读 。 和 结构 一 样 ， 有 几 种 途径 可 以 简化 这 样 的 签名 。 
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避免 子 结构 。 严 格 来 说 ， 签 名 中 完全 不 需要 描述 子 结构 ， 即 便 是 它 必 须 做 到 自 包含 。 可 
以 直接 描述 所 有 在 val 声 明 中 出 现 的 类 型 。 从 上 面 的 签名 中 去 掉 结构 Braun 会 令 可 读 性 更 强 : 
signature BRAUNPAIRI = 
sig 
type ‘a tree 
val zip: ‘a tree * 'b tree -> ('a*'b) tree 


end; 


这 个 签名 所 描述 的 要 比 BRAUNPAIR0 少 很 多 。Braun 的 所 有 组 件 都 不 见 了 ， 并 且 tree 被 描述 为 
一 个 纯粹 的 类 型 (type)。 将 free 描述 为 一 个 数据 类 型 (datatype) 则 需要 从 签名 TREE 中 
复制 它 的 完整 描述 ， 这 种 重复 不 是 很 好 。 
签名 应 该 尽 可 能 地 小 ， 因 此 BRAUNPAIR1 可 能 是 理想 的 。 如 果 能 做 到 其 中 所 描述 的 组 件 
可 以 独立 于 Braxn 中 的 组 件 使 用 ， 它 也 确实 是 理想 的 , 换 句 话说 ， 它 应 该 在 使 用 上 是 自 包 含 的 ， 
而 不 仅仅 是 形式 上 没有 自由 的 标识 各 
签名 中 的 共享 约束 。 虽 然 签 名 应 尽 可 能 地 小 ， 但 是 它 不 应 该 过 分 小 。 如 果 每 个 
BRAUNPAIR1 的 实例 都 需要 伴随 一 个 BRAUN 的 实例 ， 那 么 标识 它们 的 tree 组 件 将 需要 一 个 共享 
约束 。 每 个 如 下 形式 的 函 子 头 
functor PairFunctor0 (BP: BRAUNPAIRO) 
的 长 度 都 会 加 倍 : 
functor PairFunctort (structure Braun: BRAUN 
f structure BP: BRAUNPAIRI 
sharing type Braun.Tree.tree = BP.tree) 
解决 办 法 是 在 签名 中 同时 描述 子 结构 Braun 和 类 型 tree， 并 使 用 一 个 共享 约束 来 将 它们 关联 
起 来 : 
signature BRAUNPAIR2 = 
sig 
structure Braun: BRAUN 
type ‘a tree 
sharing type tree = Braun.Tree . tree 
val zip: ‘a tree * 'b tree -> (‘a*’b) tree 


end: 

与 此 签名 匹配 的 结构 必须 声明 类 型 a tree ， 以 满足 其 中 的 共享 约束 : 

type ‘a tree = ‘a Braun.Tree.itree 
ROA TZHMPHEORA. ARTEL ZA., WILY MPairFunctor03k FF i A A 
子 头 。 

签名 中 的 类 型 缩写 。 类 型 的 共享 约束 对 于 目前 的 用 途 来 说 已 经 足够 了 ， 也 就 是 说 可 以 将 
签名 中 的 复合 名 字 缩 短 。 但 是 ， 他 们 不 能 描述 任意 的 类 型 缩写 。 共 享 约束 是 针对 标识 符 的 ， 
而 不 是 针对 类 型 的 ， 相 应 的 共享 描述 是 


tree = Braun .Tree . tree 
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而 不 是 
‘a tree = 'a Braun.Tree. tree 
签名 是 可 以 使 用 类 型 缩写 的 。 这 是 另 一 种 缩短 复合 名 字 的 办 法 : 
signature BRAUNPAIR3 = 
sig 
structure Braun: BRAUN 
type ‘a tree = ‘a Braun. Tree . tree 
val zip: ‘a tree * 'b tree -> ('a*'b) tree 
end; i 
要 使 一 个 结构 匹配 这 样 的 签名 ， 必 须 在 里 面 声 明 一 个 等 价 的 类 型 缩写 。 
include iť. @S (include) 一 个 签名 意味 着 将 其 组 件 描述 为 直接 属于 当前 签名 的 ， 
而 不 是 属于 一 个 子 结构 的 。 描 述 


include SIG 


的 效果 相当 于 直接 书写 81G 的 内 容 ， 而 不 要 首尾 的 sig...end 框 。 我 们 的 例子 现在 变 为 
signature BRAUNPAIR4 = 
sig 
include BRAUN 
val zip: ‘a Tree.tree * 'b Tree.tree -> ('a*'b) Tree.tree 
end; 


仍 存在 复合 名 字 ， 不 过 它们 的 长 短 是 可 以 接受 的 ， 这 是 因为 子 结构 Braun 不 见 了 。 子 结构 中 的 
全 部 组 件 都 已 经 结合 在 新 的 签名 中 了 。 这 样 一 来 ，BRAUNPAIR4 的 实例 同样 匹配 签名 BRAUN。 


A 将 自己 包 入 困境 多重 包 含 是 一 种 强 有 力 的 结构 化 技术 。 它 可 以 和 共享 约束 组 
合 起 来 获得 重 命名 的 一 些 效果 。 上 比如 说 ， 如 果 被 包含 的 签名 描述 了 类 型 fo 和 from, 
那么 共享 约束 可 以 令 它 们 等 同 于 签名 中 的 其 他 类 型 (Biagioni 等 ，1994)。 标 准 库 以 
类 似 的 风格 使 用 共享 约束 ， 有 时 是 为 了 将 子 结构 中 的 组 件 重 命名 。 

要 避免 包含 有 同样 名 字 的 签名 : 这 可 能 会 赋予 一 个 标识 符 重 复 或 者 予 盾 的 描述 。 
过 多 地 使 用 nclude 会 导致 席 大 平 销 的 签名 ， 掩 益 了 模块 的 层次 结构 。 如 采 签 名 
BRAUN 自 身 使 用 了 描述 
include TREE 
而 不 是 


structure Tree : TREE 


那么 应 该 彻底 不 会 有 复合 名 字 了 。 表 面 上 看 ， 这 会 对 改进 可 读 性 有 所 帮助 ， 但 是 三 
个 不 同 结构 的 所 有 组 件 将 被 毫 无 组 织 地 丢 在 一 起 。 


模块 参考 指南 


本 节 汇 集 了 结构 、 签 名 和 函 子 的 概念 ， 并 对 模块 语言 整体 作出 了 总 结 。 本 节 从 实际 出 发 
讲述 整个 语言 ， 包 括 一 些 较为 偏僻 的 特性 。 首 先 重 温 一 下 基本 定义 。 
结构 是 一 些 声明 的 集合 ， 典 型 组 成 内 容 是 一 些 用 作 公 共用 途 的 项 目 。 这 里 面 可 能 包括 类 
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型 、 值 和 其 他 结构 。 由 于 多 个 结构 可 以 进一步 组 织 成 更 大 的 结构 ， 因 此 一 个 软件 系统 可 以 设 
计 成 为 有 层次 的 实体 。 一 个 结构 可 以 被 看 成 是 一 个 单元 ， 无 论 其 内 部 如 何 复杂 。 

签名 是 由 一 些 类 型 检测 信息 组 成 的 ， 它 们 是 结构 中 所 声明 的 每 一 项 的 类 型 信息 。 共 中 列 
出 了 类 型 、 值 及 其 类 型 、 结 构 及 其 签名 。 共 享 约束 使 不 同 子 结构 中 的 公共 组 件 成 为 一 体 。 不 
同 的 结构 可 以 具有 相同 的 签名 ， 这 种 情况 就 像 不 同 的 值 可 以 具有 相同 的 类 型 一 样 。 

西子 是 结构 到 结构 的 映射 。 函 子 体 根据 形式 参数 定义 了 一 个 结构 ， 形 式 参数 是 由 一 个 等 
名 描述 的 。 应 用 函 子 可 以 将 一 个 实际 结构 替换 进 函 子 体内 。 函 子 使 得 程序 单元 可 以 分 别 编写 ， 
并 且 可 以 表达 泛 型 单元 。 

模 决 则 是 结构 或 函 子 两 者 之 一 。 
7.16 签名 和 结构 的 语法 

本 书 的 目的 是 教授 程序 设计 技术 ， 而 不 是 完整 地 讲述 Standard ML。 然 而 模块 涉及 到 了 大 
量 的 语法 ， 这 里 便 系统 地 讲述 它们 的 主要 特性 。 


在 语法 定义 中 ， 可 选 语 名 被 方 括号 所 包括 。 可 重复 出 现 的 语句 〈 至 少 出 现 一 次 ) 则 非 严 
格 地 以 三 点 的 省 略 号 (.…) da. Bln, Æ 


exception ldi [o£ | and ... and ld, [o£ T, | 

中 ， 像 “of T,” 这 样 的 语句 是 可 选 的 。 关 键 字 and 分 隔 了 联 立 声明 。 
签名 的 语法 。 一 个 签名 形 如 
sig Spec end 


其 中 ，Spec 是 类 型 、 值 、 异 常 、 结 构 和 共享 约束 的 描述 。 
形 如 


val Id\:T, and ... and Id,:T, 


的 值 描述 了 命名 为 141,.…, Id PAR ENT), …, T,。 多 个 值 和 它们 的 类 型 可 以 联 
立 声 明 。 
类 型 可 以 如 下 《〈 联 立地 ) 描述 


type [Wpevarsi |ia, [= | and ... and |TypeVarsn a, [- T, | 


如 果 T 出 现 ， 其 中 i = 1,.…,n， 那 么 14; 则 被 描述 为 类 型 缩写 。 

允许 相等 测试 的 类 型 可 以 描述 为 

eqtype [Typevars lia, and ... and [Typevarsn id, 
在 type 和 eqtype 描 述 中 ， 类 型 都 可 以 通过 可 选 的 类 型 变量 (7TypeVars) 后 跟 一 个 标识 符 给 
出 ， 和 在 类 型 声明 的 左边 可 以 出 现 的 完全 相同 。datatype (数据 类 型 ) 描述 和 datatype 
声明 是 相同 的 。 l 

异常 ， 以 及 可 选 的 相应 类 型 ， 可 以 如 下 描述 


exception /di [o£ | and ... and id, [of T, | 
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结构 以 及 它们 的 签名 是 如 下 描述 的 
structure /d,:Sig; and ... and /d,: Sig, 
共享 约 东 则 形 如 


sharing [type] Idy = Idy = +++ = ld, 


标识 符 1d, … 14, 被 描述 为 共享 的 。 如 果 出 现 关 键 字 type 则 它们 必须 是 类 型 标识 符 ， 否 则 它们 
必须 是 结构 标识 符 。 共 享 约束 可 以 出 现在 任何 签名 中 ， 不 过 它们 大 多 出 现在 一 个 函 子 的 形式 
参数 表 中 ， 这 里 形式 参数 是 作为 一 个 签名 描述 给 出 的 。 共 享 两 个 结构 意味 着 共享 它们 中 对 应 
名 字 的 类 型 。 

包含 描述 形 如 


include Sigldi --- Sigld, 

每 个 Sigld 都 是 一 个 签名 标识 符 ，、 它 们 描述 了 该 签名 中 的 组 件 。 
O| where type 限制 词 。 最 近 提出 了 一 种 新 的 签名 形式 ， 它 允许 在 签名 8i8 中 将 类 
Sig where type |TypeVarsı Jia = T; and [TypeVarsn 1d = T, 
这 种 构造 可 以 用 于 以 非常 精细 的 方式 组 合 的 签名 场合 。 与 不 透明 签名 约 东 一 起 ， 它 
提供 了 另 一 种 声明 抽象 类 型 的 方法 。 考 虑 下 面 的 函 子 头 : 


functor Dictionary (Key: ORDER) 
:> DICTIONARY where type key = Key.t 


这 个 池子 的 结果 签名 是 一 个 DICTIONARY 的 抽象 视图 ， 不 过 Key 被 约束 为 参数 结构 Key 
所 描述 的 键 值 类 型 。 这 纠正 了 7.5 节 末 提 到 的 关于 不 迁 名 约束 的 “ 非 此 即 彼 ”的 局 限 。 
该 函 子 体 不 再 需要 使 用 abstypPe 了 。 
结构 的 语法 。 结 构 可 以 通过 由 struct 和 end 括 住 的 声明 (其 中 可 以 声明 子 结构 ) 来 创建 : 
struct D end 
结构 也 可 以 由 函 子 的 应 用 给 出 : 
Functorld (Str) 
由 Functorld 命 名 的 函 子 被 应 用 到 结构 Str 上 。 这 是 销 子 应 用 的 基本 语法 ， 在 我 们 开始 的 一 些 例 


子 里 被 用 到 ， 它 只 允许 一 个 参数 。 传 递 多 个 参数 需要 一 般 形式 的 函 子 应 用 ， 其 中 实际 参数 是 
一 个 声明 : 


Functorld (D) 
RE TAT eS 
Functorld (struct D end) 


并 且 ， 这 也 类 似 于 书写 元 组 来 作为 函数 参数 以 达到 多 个 参数 的 效果 。 
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结构 中 的 局 部 声明 形 如 
let D in Str end 

对 其 求 值 将 执行 声明 D 并 产生 结构 表达 式 Str 的 值 。D 的 作用 域 局 限于 Str 中 。 
结构 可 以 有 透明 或 不 透明 的 签名 约束 : 


Str : Sig 
Str :> Sig 


7.17 模块 声明 的 语法 

签名 、 结 构 和 孟子 的 声明 都 不 允许 出 现在 表达 式 中 。 结 构 可 以 声明 在 其 他 结构 中 ， 但 是 
BA FAB AN ERE 

签名 约束 以 :>Sig 形 式 给 出 ， 另 外 :Sig 也 是 可 以 的 。 

通过 签名 声明 ， 可 以 用 标识 符 1d1, …, 1d, 来 表示 相应 的 签名 Sig1, ..., Sign: 

signature ldi=Sig! and ... and Jd,=Sign 


通过 结构 声明 ， 就 可 以 用 标识 符 14; 来 表示 结构 Str; (并 可 选 地 指定 了 签名 Sig;) T, Hp 
1<i<n: 311 


structure Ila | : >Sigy |=Ser and ... and Idy| +> Sign |=Strn 

GAFFE A BIE AE | 
functor ld (Id': Sig’) [:>sig] = Str 

Hebd AT, Id’ 和 Sig' 是 形式 参数 的 名 字 和 签名 ，5Str 是 浪子 体 ，Sig 是 可 选 的 签名 约束 。 
函 子 声明 的 一 般 语法 具有 如 下 形式 ， 它 可 以 实现 多 个 参数 的 效果 


functor Id (Spec) [ :>sis] = Str 


形式 参数 表 由 描述 Spec 给 出 的 。 函 子 仍旧 只 有 一 个 参数 ， 它 是 一 个 结构 ， 其 签名 由 Spec 决 定 。 
这 个 形式 参数 在 函 子 体 内 被 隐 式 地 打开 ， 以 使 它 的 组 件 可 见 


要 点 小 结 


* 结构 不 隐藏 其 内 部 表示 。 

。abstype (抽象 类 型 ) 声明 可 以 和 结构 及 签名 组 合 起 来 隐藏 抽象 数据 类 型 的 内 部 细节 。 

* 函 子 是 以 其 他 结构 为 参数 的 结构 。 

。 函 子 可 以 表达 泛 型 算法 ， 并 允许 程序 单元 自由 组 合 。 

* 共享 约束 可 能 是 必要 的 ， 因 为 它 能 保证 系统 中 的 某 些 子 组 件 是 相同 的 。 | 

。 复 合 名 字 可 以 通过 多 种 方法 来 缩短 ， 其 中 包括 谨慎 地 使 用 open 声 明 。 





第 8 章 ML 中 的 命令 式 程序 设计 


函数 式 程序 设计 有 它 自身 的 优点 ， 但 是 我 们 这 里 要 讲 的 是 命令 式 程序 设计 ， 对 于 输入 输 
出 来 讲 ， 它 是 最 自然 的 。 有 些 程序 特别 关心 对 于 状态 的 维护 :比如 说 象棋 程序 必须 跟踪 棋子 
的 位 置 ! 一 些 经 典 的 数据 结构 ， 像 散 列表 ， 是 通过 更 新 数组 和 指针 的 方式 工作 的 。 

Standard ML 的 命令 式 特性 包括 引用 、 数 组 和 输入 输出 命令 。 虽 然 具 有 独特 的 ML 风格 ， 
这 些 特性 还 是 提供 了 对 命令 式 程序 设计 普遍 的 支持 。 循 环 是 通过 递归 或 使 用 while 构 造 来 表 
达 的 。 引 用 的 方式 则 与 C 或 Pascal 中 的 指针 不 尽 相同 ， 首 先 它们 是 安全 的 。 

命令 式 特性 和 函数 式 程序 设计 是 兼容 的 。 引 用 和 数组 可 以 用 于 具有 纯 尔 数 式 形式 的 函数 
和 数据 结构 中 。 我 们 将 使 用 引用 来 存储 每 个 元 素 ， 以 此 编写 序列 (惰性 表 )。 这 样 可 以 避免 重 
复 计算 造成 的 浪费 ， 这 种 重复 计算 是 5.12 节 所 述 序列 的 一 个 缺陷 。 我 们 将 在 可 变更 数组 的 辅 
助 下 编写 国 数 式 数 组 〈 其 中 每 次 更 新 都 将 建立 一 个 新 的 数组 )。 这 种 函数 式 数组 的 表示 要 比 
4.15 节 的 二 又 树 方法 高 效 得 多 。 

典型 的 ML 程序 大 部 分 是 函数 式 的 。 它 保留 了 许多 函数 式 程序 设计 的 优点 ， 包 括 可 读 性 ， 
甚至 是 效率 : 垃圾 收集 对 于 不 变 的 对 象 可 能 更 快 。 甚 至 对 于 命令 式 程序 来 说 ， 和 传统 的 语言 
相 比 ，ML 也 有 它 的 优点 。 


本 章 提要 


本 章 将 讲述 引用 类 型 和 数组 ， 并 举例 说 明 它 们 在 数据 结构 中 的 使 用 。 对 ML 的 输入 输出 技 
巧 也 会 有 所 介绍 。 

本 章 包 括 以 下 几 节 : 

。 引 用 类 型 。 引 用 代表 了 存储 位 置 ， 它 可 以 被 创建 、 更 新 和 查看 。 不 能 创建 多 态 引 用 ， 但 
是 多 态 函 数 内 可 以 使 用 引用 。 

。 数 据 结构 中 的 引用 。 这 里 介绍 了 三 个 较 大 型 的 例子 。 我 们 修改 了 序列 类 型 ， 使 其 在 内 部 
存储 计算 出 来 的 元 素 。 环 形 缓冲 区 说 明了 引用 是 如 何 表 示 链 接 数 据 结 构 和 的 。V- 数 组 在 函 
数 式 数据 结构 中 使 用 了 命令 式 的 程序 设计 技术 。 

。 输 入 和 输出 。 库 函数 可 以 将 字符 申 和 像 real 这 样 的 基本 类 型 互相 转换 。 通 道 作为 字符 流 
的 载体 将 ML 程序 和 输入 输出 设备 联系 起 来 。 我 们 的 例子 包括 了 日 期 扫描 ， 向 HTML 格 
式 的 转换 ， 以 及 代码 美化 (pretty printing). 


引用 类 型 


ML 中 的 引用 基本 上 就 是 存储 器 地 址 。 它 们 对 应 于 C、Pascal 和 其 他 类 似 语言 中 的 变量 ， 

并 且 在 链接 数据 结构 中 作为 指针 使 用 。 对 于 流程 控制 结构 ，ML 提 供 了 while-do 循 环 命令 ， 

另外 if-then-else 和 case 表 达 式 也 适用 于 命令 式 程序 设计 。 本 节 结 束 时 还 将 对 引用 类 型 
和 多 态 性 之 间 的 交互 关系 作出 讲解 。 
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8.1 引用 及 其 操作 


在 ML 程序 执行 的 过 程 中 ， 所 有 计算 出 来 的 值 都 将 在 某 段 时 间 内 停留 在 机 器 的 存储 器 中 。 
对 于 尔 数 式 程序 员 来 说 ， 存 储 器 只 是 计算 机 中 的 一 个 设备 而 已 ， 除 非 存 储 空间 不 足 ， 否 则 从 
不 需要 考虑 这 个 设备 。 而 对 于 命令 式 程序 设计 来 说 ， 存 储 空间 是 可 见 的 。ML 的 引用 表示 了 存 
储 空间 中 某 个 位 置 的 地 址 。 每 个 位 置 都 包含 一 个 值 ， 这 个 值 可 以 通过 赋值 被 替代 。 引 用 本 身 
也 是 一 个 值 ， 如 果 x* 具 有 类 型 F， 那 么 x 的 引用 则 可 以 写作 refx 并 且 具 有 类 型 rrej。 

构造 子 ref 可 以 创建 引用 ， 将 它 用 在 值 " 上 时 ， 则 会 分 配 一 个 新 地 址 并 以 v 作 为 初 值 ， 然 后 
返回 指向 该 地 址 的 引用 。 虽 然 ref 是 一 个 ML 函数 ， 但 是 它 不 是 数学 意义 上 的 函数 ， 因 为 ref 在 
每 次 调用 时 都 返回 一 个 新 的 地 址 。 

将 函数 ! 应 用 到 引用 上 时 则 返回 其 指向 的 内 容 。 这 个 操作 称 为 反 引 用 (dereferencing)。 显 
然 ! 也 不 是 一 个 数学 函数 ， 它 的 返回 值 取决 于 存储 器 的 内 容 。 

赋值 E;:=E; 首 先 对 El 求 值 ，E, 必 须 返 回 一 个 引用 p， 然 后 对 Es 求 值 ， 赋 值 将 E; 的 值 存储 在 
地 址 p 中 。 从 语法 角度 看 ，: = 是 一 个 函数 ， 且 Ei:=E2 是 个 表达 式 ， 尽 管 它 的 作用 是 更 新 存储 
器 。 如 同 大 多 数 更 新 机 器 状态 的 函数 一 样 ， 赋 值 函数 返回 类 型 uniz 的 值 0。 

下 面 是 这 些 基本 语句 的 一 个 简单 例子 : 

val p = ref 5 and q = ref 2; 

> val p = ref 5 : int ref 

> val q = ref 2 : int ref 
这 里 声明 了 引用 p 和 4， 它们 指向 的 初始 内 容 分 别 为 53 和 2。 


(ip, tq); 

> (5, 2) : int * int 
p := tp + tq; 

> () : unit 

(p, !q}); 

> (7, 2) : int * int 


赋值 将 p 的 内 容 改 变 为 7。 请 注意 “内 容 ” 这 个 词 ! 赋值 并 不 改变 p 的 值 ， 这 是 一 个 固定 的 存储 

器 地 址 ， 赋 值 改变 的 是 这 个 地 址 里 的 内 容 。 我 们 可 以 将 p 和 4 当 作 Pascal 里 面 的 整 型 变量 ， 不 同 

的 是 需要 显 式 地 进行 反 引 用 。 必 须 书写 名 来 取得 p 的 内 容 ， 而 p 本 身 代 表 一 个 地 址 。 
数据 结构 中 的 引用 。 由 于 引用 也 是 ML 里 面 的 值 ， 它 们 可 以 是 元 组 、 表 等 数据 结构 的 一 部 分 。 


val refs = [p,q.pli 
> val refs = [ref 7, ref 2, ref 7] : int ref list 


q := 1346; 
> () : unit 
refs ; 


> [ref 7, ref 1346, ref 7] : int ref list 


re 访 的 第 一 个 元 素 和 第 三 个 元 素 表 示 的 地 址 和 p 相 同 ， 而 第 二 个 元 素 所 表示 的 地 址 则 和 4 相同 。 
ML 编译 器 将 引用 打印 成 ref c， 而 不 是 表示 地 址 的 数 ， 其 中 c 是 引用 的 内 容 。 因 此 对 4 赋值 会 影 
响 refs 的 打印 结果 。 我 们 来 给 表 头 元 素 赋值 : 

hd refs := 1415; 


> () : unit 
refs; 
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> [ref 1415, ref 1346, ref 1415] : int ref list 
(p. t!a); 
> (1415, 1346) : int * int 

因为 re 六 的 首 元 素 是 p， 所 以 对 ha refs hE FIRE. 
对 于 引用 的 引用 也 是 允许 的 : 
val refp = ref p and refq = ref q; 


> val refp = ref (ref 1415) : int ref ref 
> val refq = ref (ref 1346) : int ref ref 


下 面 的 赋值 以 rep 的 内 容 (p) PAR (1415) 来 更 新 refg 的 内 容 (q)。 这 里 refp 和 refq 就 像 
Pascal 里 面 的 指针 变量 一 样 。 


irefq := !(‘refp); 
> () : unit 
(!p,'q); 


> (1415, 1415) : int * int 


引用 的 相等 。ML 的 相等 测试 对 于 所 有 的 引用 类 型 都 有 效 。 两 个 同类 型 的 引用 只 有 在 它们 
表示 同一 地 址 时 才 被 看 作 是 相等 的 。 下 面 的 测试 验证 了 p 和 4 是 不 同 的 引用 ， 而 re 大 的 首 元 素 和 
p 相 等 ， 和 g 不 等 : . i 

P=q; 

> false : bool 

hd refs = p; 

> true : bool 

hd refs = qi 

> false : bool 
在 Pascal 中 ， 如 果 两 个 指针 变量 碰巧 含有 相同 地 址 ， 那 么 它们 的 值 是 相等 的 ， 荆 值 会 使 这 两 个 
指针 相等 。ML 中 引用 相等 的 记 法 可 能 有 些 特别 ， 因 为 如 果 p 和 4 是 不 同 的 引用 ， 那么 没有 办 法 
能 使 它们 相同 (除了 重新 声明 )。 在 命令 式 语言 中 ， 所 有 变量 都 是 可 以 更 新 的 ， 这 时 指针 变量 
其 实 涉及 了 两 野 引 用 。 普 通 的 指针 相等 记 法 就 像 是 比较 re 和 refg 的 内 容 ，refp 和 refa 都 是 引用 
的 引用 : 


irefp = !refa 

> false : bool 
refq := pi 

> () : unit 
‘refp = ‘refq 


起 初 ，re 如 和 refg 含 有 不 同 的 值 ， 也 就 是 p 和 gq。 将 值 p 赋 给 refg 则 使 refp 和 refg 拥 有 相同 的 内 容 ， 
两 个 “指针 变量 ”3 引用 的 都 是 p。 

当 两 个 引用 相等 时 ， 就 像 P 和 hd refs 那 样 ， 给 其 中 一 个 赋值 也 影响 到 另 一 个 的 内 容 。 这 种 
情况 被 称 为 别名 化 (aliasing )， 它 将 造成 严重 的 混淆 。 别 名 化 会 出 现在 过 程式 语言 中 ， 在 过 程 
调用 时 ， 一 个 全 局 变量 和 一 个 形式 参数 可 能 表示 了 同一 地 址 。 


(O| 逢 环 数据 结 构 。 引 用 的 御 环 链 在 很 多 场合 都 可 以 见 到 。 假 设 我 们 声明 cp 来 引用 316 


整数 后 继 函 数 ， 并 在 cFact 画 数 中 进行 反 引 用 。 
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PSF 
val cp = ref (fn k => k+1); 
> val ep = ref fn : (int -> int) ref 
fun cFactn = if n=0 then 1 else n * !cp(n-1); 


> val cFact = fn : int -> int 
KikcFacthBAMARACPHSHAR, RAEN RHR, #LACFact(8) = 8 
x8 = 64: 


cFact 8; 
> 64 : int 


我 们 将 cp 更 新 为 包含 cFact。 现 在 cFact 通 过 cp 引用 了 自身 。 它 变 成 了 一 个 计算 阶乘 的 
递归 函数 : 


cp := cFact; 

> () : unit 
cFact 8; 

> 40320 : int 


通过 更 新 引用 来 建立 一 个 围 有 时 也 称 为 “ 打 结 *。 很 多 函数 式 语 言 的 解释 器 就 是 按照 
上 述 方式 实 现 递归 函数 的 ， 也 就 是 在 运行 环境 中 建立 一 个 国 。 

练习 8.1 判断 表达 式 的 值 是 真 还 是 假 : if E, = E then ref E = ref E, 

练习 8.2 ”声明 函数 +:= 使 得 +:= Id E 对 于 整数 E 具 有 Id := td + 的 效果 。 

练习 8.3 p 和 gq 如 前 声明 ， 解 释 当 下 列表 达 式 在 顶层 输入 时 ML 的 回应 : 


p:=!p+1 2*1g 


8.2 控制 结构 


ML 不 区 分 命令 和 表达 式 。 命 令 就 是 在 求 值 时 更 新 状态 的 表达 式 。 大 多 数 命令 都 具有 类 型 
unit 并 返回 ()。 作 为 命令 式 语言 来 看 ，ML 仅 提供 基本 的 控制 结构 。 

条 件 表达 式 

if E then E; else E 


WBE RS. CHERE., AVHRR, RARER Arve ME RA, AM 
对 E, 求 值 。 它 会 返回 E1 或 E; 的 值 ， 尽 管 在 命令 式 程序 设计 中 ， 这 个 结果 通常 都 是 0)。 

注意 ， 这 种 行为 是 由 ML 的 一 般 性 表达 式 原 则 所 致 ，ML 只 有 一 种 if 构造 。 

类 似 地 ，case 表 达 式 也 可 作为 控制 结构 : 

case E of P => E | © | Pa => En 
首先 对 E 进 行 求 值 ， 有 可 能 更 新 状态 。 然 后 ， 模 式 匹 配 会 像 通常 那样 选择 某 个 表达 式 E;。 这 个 
表达 式 将 被 求 值 ， 同 样 有 可 能 更 新 状态 ， 并 且 返 回 其 结果 值 。 


在 函数 调用 E, E, 和 n 元 组 (Ei, En ..., 已 ) 时 ， 将 从 左 到 右 地 对 表达 式 进 行 求 值 。 如 果 书 改变 
了 状态 ， 它 可 能 会 影响 已 的 后 果 。 
一 系列 的 命令 也 可 以 通过 表达 式 
(Ey; Ez; ...; En) 
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来 执行 。 当 对 这 个 表达 式 求 值 时 ， 会 对 表达 式 E1, En …, E, 从 左 到 右 分 别 求 值 ， 整 个 表达 式 的 
结果 是 E, 的 值 ， 其 他 表达 式 的 值 被 丢弃 了 。 由 于 分 号 在 ML 中 还 有 其 他 用 处 ， 上 面 这 种 构造 必 
须 用 括号 括 起 来 ， 除 非 用 在 let 表 达 式 的 主体 部 分 : 


对 于 友 代 ，ML 有 while 命 令 : 
while E, do E 


如 果 对 El 的 求 值 结果 为 false， 那 么 while 就 结束 了 ; 如 果 E1 的 结果 为 rue， 那 么 就 对 Es 进行 求 
值 ， 并 且 再 次 执行 while。 精 确 地 讲 ，while 命 令 满足 递归 方程 


while El do 本 三 if El then (Fy; while E; do E?) 
else 0 


最 后 的 返回 值 是 0)， 因 此 对 Es 进行 求 值 只 是 为 了 获得 其 对 状态 改变 的 效果 。 

简单 的 例子 。ML 可 以 模仿 过 程式 程序 设计 语言 。 下 面 的 过 程 ， 除 了 显 式 的 反 引 用 ( ! 操 
Ye) 以 外 ， 都 可 以 用 Pascal 和 C 来 书写 。 函 数 impFact 使 用 局 部 引用 resultp 和 ip 来 计算 阶乘 ， 并 
返回 resultp 的 最 后 内 容 。 观 察 一 下 如 何 使 用 while 命 令 来 将 循环 体 执行 4 次 : 


fun impFact n = 
let val resultp = ref 1 


and ip = ref 0 
in while !ip < n do (ip := lip + 1; 
resultp := !resultp * ‘ip); 
! resultp 


end; 
> val impFact = fn : int -> int 
while 循 环 体 包 括 两 个 赋值 。 在 每 次 选 代 中 都 将 记 的 内 容 加 一 ， 并 利用 记 的 新 内 容 来 更 新 
resultp 的 内 容 。 . 
虽然 调用 impFact 分 配 了 新 的 引用 。 但 是 这 个 状态 的 变化 对 外 是 不 可 见 的 。impFact(E) 的 
值 是 E 值 的 数学 函数 。 l 


impFact 6; 
> 720 : int 


在 过 程式 语言 中 ， 过 程 可 以 有 引用 参数 ( 变 参 ) ， 以 便 通过 它们 来 修改 调用 者 的 变量 。 在 
Standard ML 中 ， 引 用 参数 就 是 具有 引用 类 型 的 形式 参数 。 我 们 可 以 将 impFact 变 换 为 过 程 
pFact， 其 中 以 resultp 作 为 引用 参数 。 
fun pFact (n, resultp) = 
let val ip = ref 0 
in resultp := 1; 


while !ip < n do (ip = lip + 1; 
resultp := ‘!resultp * !ip) 
end; 
> val pFact = fn : int * int ref -> unit 


调用 pFact(n, resultp) 将 n 的 阶乘 赋值 给 resulip: 
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pFact (5,p); 
> () : unit 


> ref 120 : int ref 


这 两 个 函数 演示 了 命令 式 风 格 ， 然 而 纯粹 的 递归 函数 是 最 清晰 的 ， 大 概 也 是 最 快 的 计算 阶乘 
的 方法 。 更 为 现实 的 命令 式 程序 将 在 本 章 稍 后 介绍 。 

库 函 数 支持 。 标 准 库 声 明了 一 些 用 于 命令 式 程序 设计 的 顶层 函数 。 示 数 训 nore 忽 略 它 的 参 
数值 并 返回 0。 下 面 是 一 个 典型 用 例 ; 

if !skip then ignore (TextIO.inputLine file) 

else skip := true; 

上 面 的 输入 输出 命令 返回 一 个 字符 串 ， 而 赋值 则 返回 站。 调用 ignore 丢 弃 了 字符 串 ， 防 止 类 型 
string 和 unit 发 生 冲 突 。 对 ignore 的 参数 求 值 只 是 为 了 得 到 它 的 副作用 ， 这 里 则 是 跳 过 文件 的 下 
一 行 。 

有 时 ， 在 执行 某 个 命令 之 前 必须 取得 表达 式 的 值 。 例 如 ， 如 果 x 包 含 0.5 且 y 包 含 1.2， 我 们 
可 以 这 样 交换 它们 的 内 容 : 

y := #1 (tx, x := ly); 

> () : unit 

(tx, ty); 

> (1.2, 0.5) : real * real 
交换 之 所 以 成 功 ， 是 因为 序 偶 中 参数 的 求 值 是 依次 进行 的 。 函 数 #1 返 回 第 一 个 分 量 ， ”也 就 
是 x 原 有 的 内 容 。 中 级 库 函 数 before 为 这 个 技巧 提供 了 更 好 的 语法 。 它 只 是 简单 地 返回 它 的 第 
一 个 参数 。 | 


y := (!x before x := by); 


表 算 子 app 将 命令 应 用 到 了 表 的 每 一 个 元 素 上 。 例 如 ， 下 面 的 函数 将 同一 个 值 赋 给 了 引用 列表 
中 的 每 一 个 成 员 : 

fun initialize rs x = app (fn r => r:=X) rs; 

> val initialize = fn : ‘a ref list -> ‘a -> unit 

initialize refs 1815; 

> () : unit 

refs; 

> [ref 1815, ref 1815, ref 1815] : int ref list 
HR, app f PRL Fignore(map 了 站， 不 同 的 是 它 不 用 构造 结果 列表 。 顶 层 版 本 的 app 来 自 于 结 
构 List。 其 他 库 结构 ， 包 括 ListPair 和 Array， 也 定义 了 相应 版 本 的 app。 

上 骨 常 和 命令 。 当 一 个 异常 被 抛 出 时 ， 正 常 的 执行 流程 被 打 断 了 。 如 同 4.8 节 中 讲述 的 那样 ， 
这 时 要 选择 一 个 异常 处 理 器 ， 并 将 控制 转移 到 那里 。 这 可 能 是 危险 的 ， 异 常 可 能 会 随时 出 现 ， 
产生 一 种 不 正常 的 状态 。 下 面 的 异常 处 理 器 可 以 捕捉 任何 异常 ， 整 理 当前 状态 ， 然 后 重新 抛 
出 该 异常 。 变 量 e 是 一 个 能 匹配 所 有 异常 的 普通 的 模式 (具有 类 型 exn): 


handle e => ( … (* 整 理 动作 *) … ; raise e) 


O 2.9 节 对 形 如 故 的 选择 函数 进行 了 解释 。 
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注意 : 大 多 数 命令 都 可 以 返回 类 型 unit 的 值 0。 从 现在 起 ， 我 们 的 会 话 中 将 省 去 令 人 厌烦 的 
回应 


> () : unit 
练习 8.4 KEARE; Ey …; E,) 和 while E, do E; 在 ML 中 都 属于 派生 形式 ， 也 就 是 说 它们 是 
通过 翻译 成 其 他 表达 式 来 定义 的 。 请 叙述 〈 对 于 它们 的 ) 合适 的 翻译 。 
练习 8.5 ”书写 命令 式 版 本 的 sqgroot 函 数 ， 通 过 牛顿 -拉夫 森 方法 来 计算 实数 平方 根 (2.1747). 
练习 8.6 ”书写 命令 式 版 本 的 轴 函 数 ， 通 过 高 效 的 方法 来 计算 斐 波 那 契 数 (2.1575). 
练习 8.7 联 立 赋值 


Vi, Vo,...,Vn := Ey, Ey,..., En 


首先 对 各 个 表达 式 求 值 ， 然 后 将 它们 的 值 赋 给 相应 的 引用 。 例 如 ，x,y : =!1y, !x 交 换 了 x 和 y 的 
内 容 。 书 写 一 个 ML 函数 来 完成 联 立 赋值 。 该 函数 应 具有 多 态 类 型 (a ref) list x a list unit. 


8.3 多 态 引用 


自从 引用 被 引入 到 程序 设计 语言 中 起 ， 它 就 是 一 个 臭名 昭著 的 不 安全 因素 。 通 常 都 不 保 
留 引用 内 容 的 类 型 信息 ， 一 个 字符 码 有 可 能 被 解释 为 一 个 实数 。Pascal 避 免 了 这 种 错误 ， 保 证 
每 个 引用 只 能 包含 一 个 固定 类 型 的 值 ， 对 于 每 一 个 类 型 z， 都 采用 一 个 不 同 的 类 型 “指向 r 。 
然而 ， 在 ML 中 解决 这 个 问题 是 比较 难 的 : 当 T 是 一 个 多 态 类 型 时 ,Tt ref 又 意味 着 什么 呢 ? 除 
非 我 们 特别 小 心 ， 否 则 这 种 引用 中 的 内 容 可 能 过 一 段 时 间 就 会 发 生变 化 。 

一 个 虚构 的 会 话 。 下 面 这 个 非法 的 会 话 演示 了 如 果 只 \ 是 将 引用 粗糙 地 加 入 到 类 型 系统 中 
将 会 引起 怎样 的 错误 。 我 们 从 声明 恒 等 函 数 开始 : 

fun Ix = x; 

> val I = fn: ‘a -> ‘a 
由 于 /是 多 态 的 ， 它 可 以 应 用 到 任何 类 型 的 参数 上 。 现 在 我 们 建立 一 个 对 1 的 引用 : 

val fp = ref I; 

> val fp = ref fn: ('a -> ‘a) ref 
根据 它 的 多 态 类 型 (a 一 a) ref， 我 们 应 该 能 将 户 的 内 容 应 用 到 任何 类 型 的 参数 上 : 

(‘fp true, ‘fp 5); 

> (true, 5) : bool * int 
同时 ， 它 的 多 态 类 型 使 我 们 可 以 将 类 型 为 boof ~ boot 的 函数 赋值 给 包 : 


fp := not; 
ip 5; > 


将 not 应 用 到 整数 5 上 面 是 一 个 运行 时 的 类 型 错误 ， 但 是 我 们 认为 ML 应 该 在 编译 时 就 能 检测 出 
所 有 的 类 型 错误 。 显 然 是 某 个 地 方 出 了 问题 ， 但 是 哪儿 出 了 问题 呢 ? 

多 态 性 和 替换 。 在 不 考虑 命令 式 的 情况 下 ， 重 复 地 对 一 个 表达 式 求 值 总 是 得 到 相同 的 结 
果 。 声 明 val id = E 使 得 Id 成 为 这 个 表达 式 结果 的 同义词 。 忽 略 效 率 因素 ， 我 们 可 以 在 所 有 14 
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出 现 的 地 方 用 天 来 替换 。 
例如 ， 这 里 有 两 个 多 态 声明 ， 一 个 是 函数 的 声明 ， 另 一 个 是 表 的 声明 : 
let val / = fn x => x in (I true, I 5) end; 
> (true, 5) : bool * int 
let val nill = [[]] in (["Exeter"]::nill, [1415]::nill) end; 
> ([["Exeter"], []], [[1415], []}}) 
> : string list list * int list list 


替换 掉 声 明 既 不 影响 返回 值 ， 也 不 影响 类 型 : 


((fn x => x) true, (fn x => x) 5); 

> (true, 5) : bool * int 

(("Exeter"]::[{}]], {[1415]::[[]}); 

> ([["Exeter"], (]], (€(1415], []]ì 
322 > : string list list * int list list 


现在 让 我 们 来 看 看 当 那 个 虚构 的 会 话 被 包装 在 1et 表 达 式 中 时 ，ML 是 怎样 回应 的 : 
let val fp = ref I 
in ((!fp true, ‘fp 5), fp := not, ‘fp 5) end; 
> Error: Type conflict: expected bool, found int 
谢 天 谢 地 ，ML 不 接受 这 个 表达 式 ， 并 且 给 出 了 含义 确切 的 错误 信息 。 如 果 将 声明 替换 掉 又 会 
发 生 什么 呢 ? 
((! (ref 1) true, !(ref I) 5), (ref I) := not, !(ref D 5); 
> ({true, 5), (), 5) : (bool * int) * unit * int 
对 表达 式 的 求 值 没有 出 错 。 但 是 这 个 替换 完全 改变 了 表达 式 的 含义 。 原 来 的 表达 式 分 配 了 一 
个 引用 如 ， 其 初始 内 容 为 !， 然 后 两 次 提取 它 的 内 容 ， 接 着 更 新 并 最 后 提取 新 的 内 容 。 修 改 后 
的 表达 式 分 配 了 四 个 不 同 的 引用 ， 每 个 都 被 赋 给 初始 内 容 !。 中 间 的 赋值 是 没有 意义 的 ， 它 更 
新 了 一 个 其 他 地 方 没有 用 到 的 引用 。 
问题 的 关键 是 ， 重 复 地 调用 ref 总 是 产生 新 的 引用 。 我 们 声明 val fp = ref 是 期 望 每 个 户 出 
现 的 地 方 都 能 表示 同一 个 引用 : 也 就 是 同一 个 存储 地 址 。 替 换 并 没有 考虑 到 户 的 共享 。 多 态 
性 在 处 理 每 个 标识 符 的 类 型 时 都 用 它 的 定义 表达 式 的 类 型 来 替换 ， 因 此 要 假设 替换 是 有 效 的 。 
问题 出 在 共享 上 ， 而 不 是 副作用 上 。 我 们 必须 对 多 态 引 用 的 创建 加 以 控制 ， 而 不 是 控制 
它们 的 赋值 。 l 
多 态 值 的 声明 。 语 法 值 (syntactic value) 是 一 种 简单 到 不 能 创建 引用 的 表达 式 ， 它 具有 
以 下 几 种 形式 : 
。 文 字 常 数 ， 比 如 3 ， 是 语法 值 。 . 
。 标 识 符 也 是 一 种 ， 因 为 它 代表 了 其 他 某 个 已 经 处 理 过 的 声明 。 
.。 语 法 值 可 以 经 由 其 他 语法 值 通过 使 用 元 组 、 记 录 和 构造 子 (ref 除外 ) 的 形式 构建 。 
。 采 用 fn 记 法 的 函数 是 语法 值 ， 即 便 它 的 函数 体内 使 用 了 ref， 因 为 函数 体 在 函数 被 调用 
之 前 不 会 执行 。 
对 于 ref 和 其 他 函数 的 调用 不 是 语法 值 。 
如 果 E 是 一 个 语法 值 ， 那 么 多 态 声明 val Id = ZE 在 替换 下 是 等 价 的 。 这 种 声明 的 多 态 和 人 往 
BE: 每 个 1 的 出 现 都 可 以 具有 的 多 态 类 型 的 不 同 实例 。 每 个 fun 声 明 也 都 如 此 处 理 ， 因 
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为 它 只 是 带 有 fn 记 法 的 val 声 明 的 简短 形式 ， 而 fn 记 法 是 语法 值 。 

如 果 E 不 是 个 语法 值 ， 那 么 声明 val Id = E 有 可 能 创建 引用 。 为 了 顾及 共享 ， 每 个 14 的 出 
现 必须 具有 同一 类 型 。 如 果 该 声明 出 现在 一 个 let 表 达 式 中 ， 那 么 每 个 E 类 型 中 的 类 型 变量 在 
整个 let 表 达 式 体 中 都 将 被 固定 。 表 达 式 

let val fp = ref I 

in fp := not; ‘fp 5 end; 
是 不 合法 的 ， 因 为 ref 1 涉及 类 型 变量 a， 它 不 能 同时 代表 bool 和 int。 同 样 ， 表 达 式 

let val fp = ref I 

in (!fp true, ‘fp 5) end; 
也 是 不 合法 的 。 但 是 这 个 表达 式 是 安全 的 : 如 果 我 们 可 以 对 其 求 值 ， 结 果 会 是 (1rue, 5), mw 
有 运行 错误 。 单 态 的 版 本 是 合法 的 : 

let val fp = ref 1 


in fp := not; ‘fp true end; 
> false : bool 


当天 不 是 语法 值 时 ， 顶 层 的 多 态 声明 是 被 禁止 的 ， 因 为 类 型 检测 器 不 能 预测 之 后 fd 将 被 如 何 
使 用 : 

val fp = ref I; 

> Error: Non-value in polymorphic declaration 
单 态 的 类 型 约束 可 以 使 顶层 声明 成 为 合法 的 。 下 面 的 表达 式 不 再 是 创建 多 态 引用 : 

val fp = ref (1: bool -> bool); 

> val fp = ref fn*>: {bool -> bool) ref 

命令 式 的 表 翻 转 。 现 在 来 看 一 个 实际 的 多 态 性 的 例子 。 函 数 irev 以 命令 式 的 方式 翻转 了 一 
个 表 。 它 用 一 个 引用 对 表 进 行 扫 描 ， 同 时 用 另 一 个 引用 反 向 积累 表 的 元 素 。 


fun irev | = 
let val resultp = ref [] 
and Ip = refl 
in while not (null (‘lp)) do 
(resulip := hd(!ip) :: !resultp; 
lp := tl(!lp)); 
! resultp 
end; 
> val irev = fn : ‘a list -> ‘a list 324 


变量 Dp 和 resultp 都 具有 类 型 (a list) ref， 类 型 变量 a 在 let 表 达 式 体内 是 固定 的 。ML 接 受 irev 作 
为 一 个 多 态 函 数 ， 因 为 它 是 通过 fun 声 明 的 。 

我 们 也 可 以 验证 irev 的 确 是 多 态 的 : 

irev (25,10,1415]; 

> [1415, 10, 25] : int list 

irev (explode ("Montjoy")); 

> [#"y", #"o", #"j", #"t", #"n", #"0", #"M"] 

> : char list 


它 可 以 像 标 准 函 数 rev 一 样 使 用 。 
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多 态 异 常 。 虽 然 异常 并 不 涉及 存储 器 ， 但 是 它们 也 需要 某 种 形式 的 共享 。 看 看 下 面 的 错 
误 程 序 : 


exception Poly of ‘a; (* 不 合法 1!! *) 

(raise Poly true) handle Poly x => x+1; 
如 果 这 个 表达 式 可 以 被 求 值 的 话 ， 它 会 试图 对 true + 1 进行 求 值 ， 这 是 一 个 运行 错误 。 当 声明 
一 个 多 态 异 常 时 ，ML 要 保证 它 只 被 作为 一 种 类 型 使 用 ， 就 像 限制 值 声明 一 样 。 顶 层 的 异常 必 
须 是 单 态 的 ， 并 且 局 部 异常 中 的 类 型 变量 要 被 固定 。 

值 多 态 性 的 局 限 。 像 在 5.4 节 提 到 过 的 那样 ， 将 多 态 限 制 在 语法 值 上 的 做 法 排除 了 一 些 很 
自然 的 多 态 声明 。 大 多 数 情况 下 ， 这 些 都 可 以 很 容易 地 被 修正 ， 比 如 说 使 用 fun 赫 代 val: 

val length = foldi (fn (_,n) => n+1) 0; (* 被 拒绝 *) 

fun length | = foldl (fn (_,n) => n+1) O l;  (* 被 接受 *) 
编译 时 类 型 检测 必须 有 保留 地 假设 运行 时 可 能 发 生 的 事情 。 类 型 检测 拒绝 了 很 多 本 来 可 以 安 
全 执行 的 程序 。 尽 管 表达 式 hd [5, true] + 3 的 类 型 是 错误 的 ， 但 是 可 以 很 安全 地 对 它 求 值 而 得 
到 8。 大 多 数 现代 语言 都 使 用 编译 时 类 型 检测 ， 而 程序 员 也 接受 这 些 限制 ， 以 避免 运行 时 的 类 
型 错误 。 


Ol 多 坊 引用 的 历史 。 很 多 人 部 曾经 对 多 态 引 用 进行 过 研究 ， 但 是 通常 部 承认 是 
Mads Tofte 解 决 了 这 个 问题 。 早 期 的 ML 编译 器 禁止 了 所 有 的 多 态 引 用 : 函数 re 只 能 
具有 单 态 类 型 。Tofte 最 初 的 建议 在 ML 定义 中 被 采用 ， 它 比 现在 用 到 的 要 宽松 。 特 殊 
的 “ 弱 ” 类 型 变量 用 于 跟踪 命令 式 特性 ， 只 有 这 些 变量 在 val 声 明 中 被 加 以 限制 。 
Standard ML of New jersey 则 使 用 了 一 个 实验 性 质 的 方案 ， 其 中 弱 类 型 变量 具有 用 数 
值 标记 的 弱 度 。 

弱 类 型 变量 产生 了 复杂 且 不 直观 的 类 型 。 它 们 对 irev 和 rev 赋 了 予 了 不 同 的 类 型 ， 这 
妨碍 了 两 个 溃 数 的 互 换 使 用 。 最 糟 的 是 ， 它 们 使 得 在 实现 相应 结构 之 前 ， 很 难事 先 
写 出 签名 。 

Wright (1995) 建议 平等 地 对 待 所 有 的 Val 声明 一 一 其 效果 是 使 所 有 的 类 型 变量 
变 弱 。 纯 函数 式 代码 会 被 当做 命令 式 代码 看 待 。 程 序 员 会 容忍 这 种 限制 吗 ? Wright 使 
用 了 一 个 修改 过 的 类 型 检测 器 来 测试 过 大 量 他 人 书写 的 ML 代码 ， 结 果 经 过 他 的 限制 
之 后 只 产生 了 很 少 的 错误 ， 并 且 那 些 错误 是 易于 修补 的 。 因 此 ， 经 过 充分 考虑 后 ， 
将 这 个 建议 推荐 给 了 ML。 

在 Standard ML 中 对 于 多 态 引 用 的 类 型 检测 大 概 是 安全 的 。Tofte (1990) 证 明了 
它 对 于 一 个 ML 子 集 的 正确 性 ， 并 且 没 有 理由 去 怀疑 它 对 于 整个 语言 的 正确 性 。 
Greiner (1996) 研究 过 一 个 简化 版 的 New Jersey 系 统 。Harper (1994) 讲述 了 对 于 这 
种 证 明 的 一 个 简单 方案 。Standard ML 经 过 了 非常 谨慎 的 定义 ， 以 避免 不 安全 和 其 他 
语义 上 的 缺陷 ， 从 这 方面 看 ， 这 个 语言 实际 上 是 独 具 一 格 的 。 

练习 8.8 这 个 表达 式 合法 吗 ? WI 是 做 什么 的 ? 


let fun WI x = !(ref x) 
in (WI false, WI "“Clarence") end 
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练习 8.9 正面 哪些 表达 式 是 合法 的 ? 如果 可 以 求 值 的 话 ， 哪 个 会 导致 运行 时 类 型 错误 ? 


val funs = [hd]; 

val ł = rev (J; 

val I' = tl [3]; 

val Ip = let fun nilp x = ref [fl in nilp() end; 


数据 结构 中 的 引用 


任何 算法 方面 的 书 都 会 讲述 像 表 和 树 这 样 的 递归 数据 结构 。 这 些 数 据 结构 和 ML 的 递归 数 
据 类 型 ( 见 第 4 章 ) 有 所 不 同 ， 主 要 表现 在 : 前 者 的 递归 用 到 了 显 式 的 链接 域 ， 或 者 说 指针 。 
这 些 指 针 可 以 被 更 新 ， 使 其 能 重新 链接 已 有 的 数据 结构 ， 并 创建 圈 。 

引用 类 型 和 递归 数据 类 型 结合 在 一 起 可 以 实现 这 样 的 链接 数据 结构 。 本 节 给 出 两 个 这 样 
的 例子 : 双 循 环 链接 表 和 一 个 高 效 的 函数 式 数组 。 我 们 从 一 个 简单 一 点 的 引用 使 用 开始 : 不 
是 作为 链接 域 ， 而 是 用 来 存储 先前 的 计算 结果 。 


8.4 AI. REER 
在 5.12 节 给 出 的 表示 法 下 ， 序 列 的 尾部 是 个 计算 另 一 序列 的 函数 。 每 当 查看 尾部 时 ， 一 个 
代价 可 能 颇 高 的 函数 调用 就 被 重复 一 次 。 我 们 可 以 不 采用 这 种 低 效 的 做 法 。 通 过 引用 来 表示 


序列 尾部 ， 这 个 引用 开始 包含 了 一 个 函数 ， 后 来 被 更 新 为 函数 的 结果 。 这 样 实 现 的 序列 利用 
了 可 变更 的 存储 空间 ， 但 是 从 外 面 看 ， 它 仍 是 纯 函 数 式 的 。 


序列 的 抽象 类 型 。 结 构 ImpSeq 实 现 了 惰性 表 ， 见 图 8-1。 类 型 a ! 有 三 个 构造 子 : Ni 用 于 . 


构造 空 序列 ，Cons 用 于 构造 非 空 序列 ， 而 Delayed 则 人 允许 对 尾部 进行 延 时 求 值 。 一 个 具有 如 下 
形式 的 序列 | 
Cons(x, ref (Delayed xf )) 

BWIA, JERSE A CHRR, Kafka Munit-at. 注意 Delayed xf 
含 在 一 个 引用 单元 中 。 应 用 force 将 它 更 新 为 包含 xf0) 的 返回 值 ， 去 掉 Delayed。 这 样 做 会 有 一 
些 开销 ， 但 是 一 旦 序列 元 素 再 次 被 访问 ， 则 效率 会 显著 提高 。 

函数 ml 测试 序列 是 否 为 空 ， 而 hd 和 1 返回 序列 的 首 元 素 和 尾 元 素 。 由 于 调用 了 Jorce， 
因此 序列 最 外 野 的 构造 子 不 可 能 是 Delayed。 在 结构 ImpSeq 内 部 ， 序 列 上 的 函数 可 以 利用 模式 
匹配 ; 而 在 外 部 ， 则 必须 使 用 null、hd 和 ti， 这 是 因为 构造 子 都 被 隐藏 了 。 不 透明 的 签名 约束 
保证 了 结构 可 以 产生 一 个 抽象 类 型 : 


signature IMP_SEQUENCE = 


sig 

type ‘at 

exception Empty 

val empty : ‘at 

val cons : ‘a * (unit -> 'a t) -> ‘at 
val null : ‘a t -> bool 

val hd : ‘at -> ‘a 

val wl :‘at-> ‘at 

val take : ‘at * int -> ‘a list 

val toList : ‘at -> ‘a list 


val fromList : ‘a list -> ‘a t 


326 





250 


val @ :tx ar -> Qt 

val interleave : 'a t * 'a t -> 'at 

val concat : att ->'at 

val map : (a -> 'b) -> 'a t -> ‘bt 

val filter : (‘a -> bool) -> 'a t -> 'a t 
val cycle : ((unit -> 'a t) -> 'a t) -> ‘at 
end; 















structure ImpSeq :> IMP-SEQUENCE = 
struct 
datatype ‘a t = Nil 

| Cons .of 'a * (a t) ref 

| Delayed of unit -> ‘a t; 

exception Empty; 

fun delay xf = ref (Delayed xf); 

val empty = Nil; 

fun cons(x,x) = Cons(x, delay xf); 


fun force xp = 
case !xp of 
Delayed f => let val s = f() 
in xp := s; s end 
| s => s; 





null Nil = true 
| null (Cons _) = false; 
fun hd Nil = raise Empty 
| hd (Cons(x,_)) = x; À 










fun ¢ Nil 
tl (Cons(_,xp)) 


raise Empty 
force xp; 

take (xq, 0) = [] 
| take (Nil, n) = [] 
take (Cons(x,xp), n) x :: take (force xp, n-1); 











1 















Nil @ yq = yq 
| (Cons(x,xp)) @ yq 
Cons (x, delay(fn()=> (force xp) @ yq)); 





map f Nil = Nil 
| map f (Cons(x,xp)) = 
Cons (f x, delay(fn()=> map f (force xp))); 






cycle seqfn = 
let val knot = ref Nil 


in knot := seqfn (fn()=> !knot); !knot end; 


图 8-1 使 用 引用 的 惰性 表 
循环 序列 。 函 数 cycle 通 过 打 结 建立 了 一 个 循环 序列 。 下 面 是 一 个 尾部 是 其 自身 的 序列 : 


PSE 
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这 个 序列 的 表现 就 像 是 无 穷 序 列 "Nevez"，"Never"，…， 但 是 只 占用 了 计算 机 中 很 少量 的 
空间 。 它 是 通过 如 下 调用 建立 的 : 


ImpSeq .cycle (fn xf => ImpSeq.cons("Never", xf)); 

> - : string ImpSeq.t 

ImpSeq . take (it, 5) ; 

> ["Never", "Never", "Never", "Never", "Never"] 
> : string list 


当 应 用 cycle 于 某 个 seqfn 函 数 时 ， 它 创建 了 引用 knot， 并 将 它 (包装 成 一 个 函数 ) 提供 给 seqfn。 
seqfn 的 结果 是 一 个 序列 ， 这 个 序列 随 着 其 中 元 素 的 计算 最 终 将 引用 knot 中 的 内 容 。 更 新 knot 使 
它 包含 这 个 序列 本 身 ， 这 样 便 建立 了 一 个 圈 。 

循环 序列 能 够 以 奇妙 的 方式 计算 斐 波 那 契 数 。 定 义 add 函 数 ， 它 将 两 个 整数 序列 逐 项 相 加 ， 
返回 和 序列 。 为 了 说 明 引 用 的 多 态 性 ，add 要 基于 另 一 个 函数 来 编写 ， 该 函数 将 两 个 序列 合并 
为 一 个 序 偶 序列 : 


fun pairs(xq,yq) = 
ImpSeq . cons ( (ImpSeq.hd xq, ImpSeq.hd yq), 
fn () =>pairs (ImpSeq.tl xq, ImpSeq.tl yq)); 
> val pairs = fn A 
> : ‘a ImpSeq.t * ’b ImpSeq.t -> (‘a * ‘b) ImpSeq.t 
fun add (xq,yq) = ImpSeq.map Int.+ (pairs(xq,yq)); 
> val add = fn 
> : int ImpSeq.t * int ImpSeq.t -> int ImpSeg.t 


斐 波 那 契 数 序列 可 以 利用 cycle 来 定义 : 


val fib = ImpSeq.cycle(fn fibf => 
ImpSeq.cons(1, fn()=> 
ImpSeq.cons(1, £n()=> 
add (fibf () , ImpSeq.tl(fibf()))))); 
> val fib = - : int ImpSeg.t 


这 个 定义 是 循环 的 。 序 列 由 1，1 开 始 ， 其 余 的 元 素 通过 将 这 个 序列 和 其 尾部 序列 相 加 获得 : 
add (fib, ImpSeq.tl fib) 


开始 ，fib 可 以 画 成 这 样 : 





当 通 过 tl (tl fib) 访 问 fib 的 第 三 个 元 素 时 ，add 调 用 计算 出 2， 然 后 force 将 序列 更 新 成 下 面 的 
样子 : 
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由 于 序列 是 循环 的 ， 并 且 保留 计算 出 的 元 素 ， 因 此 每 个 斐 波 那 契 数 只 计算 一 次 。 这 是 相当 快 
的 。 如 果 斐 波 那 契 数 是 用 5.12 节 的 序列 来 递归 定义 的 话 ， 计 算 第 "项 的 代价 将 是 以 z 为 指数 的 。 


练习 8.10 ” 海 明 (Hamming) 问题 是 按 升序 枚 举 所 有 形 如 2'3/54 的 整数 。 声 明 一 个 由 这 些 数组 
成 的 循环 序列 。 提 示 : 声明 一 个 合并 升序 序列 的 函数 ， 并 参考 下 图 : 


练习 8.11 实现 函数 iterates， 在 给 定 放 [x 时 ， 创建 序列 [x, Ax), APO), +f"), …] 的 一 个 循环 表示 。 
练习 8.12 ”讨论 证 明 循环 序列 是 否 正确 的 难度 ， 正确 是 指 可 以 产生 满足 给 定 描述 的 值 序列 。 评 论 
下 面 这 个 序列 : 
val fib2 = ImpSeq.cycle(fn fibf => 
ImpSeq.cons(1, fn()=> add (fibf(), ImpSeq . tl (fibf ())))); 


练习 8.13 编写 在 结构 /mpSeq 中 缺少 的 , 而 又 在 其 签名 中 描述 了 的 函数 ， 也 就 是 toList、fromList、 
interleave、concat 和 和 filter, 
8.5 环形 缓冲 区 


双向 链接 表 可 以 从 正 向 或 反 向 读 取 ， 并 允许 元 素 在 任意 位 置 插入 和 删除 。 当 它 闭合 回 到 
自身 时 就 是 循环 的 : 
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iX Pha] BBLS RA PRY RR (ring buffer)， 应 该 为 大 多 数 程序 员 所 熟悉 。 在 此 ， 
我 们 实现 它 以 对 Standard ML 中 的 引用 和 过 程式 语言 中 的 指针 变量 作 一 比较 。 我 们 来 定义 一 个 
抽象 类 型 ， 它 县 有 如 下 签名 : 


signature RINGBUF = 


sig 

eqtype ‘at 

exception Empty 

val empty : unit -> 'a t 
val null : ‘at -> bool 
val label : 'a t -> ‘a 
val moveLeft : ‘at -> unit 
val moveRight : 'a t -> unit 
val insert : at * a -> unit 
val delete : /at -> ‘a 
end; 


环形 缓冲 区 具有 类 型 w !+， 是 一 个 指向 双向 链接 表 的 引用 。 新 的 环形 缓冲 区 可 以 通过 调用 国 数 
empty Kl. BR nullM RAR KEG AZ, label 则 返回 当前 结 点 的 标签 ， 此 外 ， 
moveLeft 和 moveRight 分 别 将 指针 移 向 当前 结 点 的 左边 和 右边 。 如 下 所 示 ，insert(buf, e) 将 标签 
为 e 的 结 点 播 入 到 当前 结 点 的 左边 。 两 个 链接 项 被 重 定向 到 新 的 结 点 ， 它 们 原先 的 指向 以 虚线 
稍 头 表示 ， 它 们 最 终 的 指向 以 阴影 箭头 表示 : 





函数 deiere 移 走 了 当前 结 点 ， 并 将 指针 向 右 移动 。 函 数 的 返回 值 是 被 删除 结 点 的 标签 。 

图 8-2 所 示 代 码 和 用 Pascal 书 写 出 来 的 差不多 。 双 向 链接 表 的 每 个 结 点 都 具有 类 型 a buf, 
其 中 含有 一 -个 标签 和 指向 其 左右 结 点 的 引用 ， 给 定 一 个 结 点 ， 函 数 leftr 和 right 就 可 以 分 别 返 回 
这 两 个 引用 。 

构造 子 Ni! 表 示 空 表 ， 同 时 也 起 到 了 占 位 的 作用 ， 就 像 Pascal 的 nil 指 针 一 样 。 单 有 类 型 a 
buf 的 构造 子 Node 是 无 法 创建 任何 a buf 值 的 。 看 一 下 insert 的 代码 ， 当 创建 第 一 个 结 点 时 ， 它 
的 左右 指针 开始 都 只 包含 Nil， 然 后 它们 被 更 新 为 包含 结 点 自身 的 表 。 

请 牢记 ML 中 的 引用 相等 和 通常 概念 下 的 指针 相等 不 同 。 函 数 delete 必 须 检测 是 否 正在 删 
除 缓冲 区 中 仅 有 的 一 个 结 点 。 要 确定 Nie(p, x, rp) 是 否 是 仅 有 的 结 点 不 能 通过 检测 lp = rp 是 
否 成 立 来 完成 ， 这 和 Pascal 程 序 员 所 期 望 的 不 同 。 在 正确 构造 出 来 的 缓冲 区 中 ， 这 个 检测 总 是 
不 成 立 的 ， 每 个 链接 域 必定 是 不 同 的 引用 ， 这 样 才 可 能 对 它们 分 别 进行 更 新 。 进 行 lefi(!1p) = 
1p 的 测试 是 正确 的 。 如 果 左 侧 的 结 点 (也 就 是 !p) 和 当前 结 点 具有 相同 的 左 链接 ， 那 么 它们 
就 是 同一 个 结 点 ， 因 此 也 就 是 缓冲 区 中 仅 剩 的 结 点 。 

下 面 是 一 个 环形 缓冲 区 的 小 型 演示 。 首 先 ， 我 们 来 创建 一 个 空 缓冲 区 。 由 于 对 empty 的 调 
用 不 是 一 个 语法 值 ， 我 们 必须 将 它 的 结果 约束 到 某 个 单 态 类 型 上 ， 在 这 里 是 string。( 和 空 序 
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FllimpSeq empty tees, 后 者 不 包含 引用 ， 并 且 是 多 态 的 .) 


val buf: string RingBuf.t = RingBuf .empty(); 
> val buf = - : string RingBuf.t 
RingBuf .insert (buf, "They"); 







structure RingBuf :> RINGBUF = 
struct 
datatype ‘a buf = Nil | Node of 'a buf ref * ‘a * 'a buf ref; 
datatype ‘at = Ptr of 'a buf ref; 

exception Empty; 










fun left (Node(lp,_,_)) = Ip 
| left Ni - = raise Empty; 


fun right (Node(_,_.rp)) = rp 
right Nil = raise Empty; 





















fun empty() = Ptr(ref Nil); 


fun null (Pir p) = case Ip of 
Nil => true 
| Node(_,x,_) => false; 





label (Ptr p) = case !p of 
Nil => raise Empty 
| Node(_,x,_) => x; 











moveLeft (Ptr p) = (p: 
moveRight (Ptr p) = (p: 


! (left(!p))); 
t (right('p))); 















insert (Ptr p, x) = 
case !p of 









Nil => 
let val ip = ref Nil 
and rp = ref Nil 
val new = Node (Ip,x,rp) 
in lp := new; rp := new; p := new end 


| Node(lp,_._) => 
let val new = Node(ref(‘ip), x, ref (!p)) 
in right(!ip) := new; Ip := new end; 






fun delete (Ptr p) = 
case !p of 
Nil => raise Empty 
| Node(lp,x,rp) => 
(if left(!ip) = Ip then p := Nil 
else (right(!Ip) := !rp; left (irp) := ilp; p := !1p); 
x) 









图 8-2 作为 双向 链接 表 的 环形 缓冲 区 


如 果 只 进行 insert 和 delete， 那 么 环形 缓冲 区 就 像 是 一 个 可 变更 的 队列 ， 元 素 在 插入 后 可 以 按 
同样 的 顺序 取出 。 
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RingBuf . insert (buf, "shall"); 
RingBuf .delete buf ; 

> "They" : string 

RingBuf .insert (buf, "be"); 
RingBuf .insert (buf, *famed") ; 
RingBuf .delete buf ; 

> "shall" : string 
RingBuf .delete buf ; 

> "be" : string 

RingBuf .delete buf ; 

> "famed" : string 


练习 8.14 修改 delete， 返 回 一 个 布尔 值 而 不 是 标签 : true 表 示 删 除 后 的 缓 促 区 为 空 ， 而 false 

则 相反 。 

练习 8.15 ”下 列 哪些 相等 测试 可 以 用 于 检测 Node(ip,x, rp) 是 否 为 环形 缓冲 区 中 仅 有 的 结 点 ? 
lp =!rp right('lp) = Ip right(\lp) = rp 


练习 8.16 ”比较 下 面 的 插入 函数 和 insert， 下 面 的 函数 是 否 有 长 处 或 短处 ? 
fun insert2 (Ptr p, x) = 
case !p of 
Nil => p := Node(p,x,p) 
| Node(lp,_,_) => 

let val new = Node(lp,x.p) 

in right(!ip) := new; Ip := new end; 
练习 8.17 编写 另 一 版 本 的 insert 来 将 新 结 点 插入 到 当前 结 点 的 右 侧 而 不 是 左 侧 。 333 

a 

练习 8.18 ”证 明 如 果 可 以 声明 类 型 为 a RingBuft ( 强 类 型 变量 ) 的 值 ， 那 么 将 会 产生 运行 错误 。 [334 
练习 8.19 ”类 型 a RingBuf.t 上 的 相等 测试 有 什么 用 处 ? 


8.6 可 变更 的 数组 和 函数 式 的 数组 
Standard ML 定义 中 并 没有 提 及 数组 ， 但 是 标准 库 中 提供 了 结构 Array， 它 具有 如 下 签名 : 


signature ARRAY = 


sig 

eqtype ‘a array 

val array : int * ‘a -> ‘a array 

val fromList : ‘a list -> ‘a array 

val tabulate ; int * (int -> ‘a) -> ‘a array 
val sub : ‘a array * int -> ‘a 

val update : ‘a array * int * ‘a -> unit 
val length : ‘a array -> int 

end; 


每 个 数组 都 有 固定 的 大 小 。 一 个 n 元 素 的 数组 允许 下 标 范 围 为 0 到 n-1。 数 组 操作 在 超出 边界 时 
抛 出 异常 Subscript， 在 试图 创建 负 大 小 或 特别 大 的 数组 时 抛 出 异常 Size。® 


日 这 些 异常 在 库 结 构 General 中 声明 。 





256 Z8 


下 面 简单 讲述 了 主要 的 数组 操作 : 
。array(n, x) 创 建 一 个 n 元 素数 组 ， 并 将 x* 存 人 每 个 单元 。 
e fromList [xo, X1, ++, Xn- 创建 一 个 n 元 素数 组 ， 并 将 x 存 入 单元 x 中， 其 中 k=0,…,n-1。 
。tabulate(n,f) 创 建 一 个 4 元素 数组， 并 将 fk) 存 入 单元 中、 其 中 k = 0,…,n-1。 
。sub(A, 有 ) 返 回 数组 4 中 单元 Kk 的 内 容 。 
，。 update(A, k, x) 将 数组 4 中 单元 k 的 内 容 更 新 为 x。 
。length(4) 返 回 数组 4 的 大 小 。 
数组 是 可 变更 的 对 象 ， 它 的 行为 很 像 引 用 。 数 组 间 总 是 允许 相等 测试 : 两 个 数组 相等 当 且 仅 
当 它 们 是 同一 对 象 时 。 也 可 以 创建 数组 的 数组 ， 就 像 Pascal 一 样 ， 用 来 作为 多 维 数组 。 


Ol 标准 库 的 聚合 结构 。 类 型 为 a array 的 数组 可 以 被 更 新 。 不 变数 组 提供 对 静态 数 
据 的 随机 访问 ， 并 且 可 使 函数 式 程序 效率 更 高 。 摩 结构 Vector 声明 了 不 变数 组 的 类 型 
a vector (向 量 )。 该 结构 提供 了 与 4rray 几 乎 相同 的 操作 ，xpdate 除 外 。 函 数 apuiate 
和 fromList 是 创建 向 量 ， 而 Array.extract 则 是 从 数组 中 提取 向 量 。 

由 于 类 型 a array 和 ca vector 部 是 多 态 的 ， 对 每 个 元 素 ， 它 们 需要 额外 一 层 间接 。 
单 态 数组 和 向 量 可 以 更 为 紧凑 地 表示 。 库 签名 MONO_4RRA4T 描 述 了 另 一 个 类 型 elem 
上 的 可 变更 数组 类 型 array。 签 名 MONO_VECTOR 也 是 类 似 的 ， 描 述 了 不 变数 组 类 型 
yector。 多 个 库 函 数 结构 满足 这 个 签名 ， 它 们 给 出 了 字符 数组 和 浮 点 数 数组 等 。 

亩 认为 数组 、 向 量 甚 至 是 表 都 出 于 同一 概念 : 聚合 。 相 应 的 操作 尽 可 能 地 保持 
一 致 。 数 组 和 表 一 样 具有 app 和 折 枉 算 子 。 孙 数 hrray: 六 omList 将 一 个 表 转 换 成 数组 ， 
相对 应 的 北 操 作 也 很 容易 编写 : 

fun toList | = Array.foldr op:: [] l; 


A fo in — HF tabulate kk, ARAM LA TIRE, MRA HI, HLR 
A th A He ch HH Subscript. 


表示 函数 式 数组 。Holmstr6m 和 Hughes 开 发 了 一 种 混合 式 的 函数 式 数 组 表示 法 ， 用 到 了 可 
变更 数组 和 关联 表 。 由 (index, contents) (索引 和 内 容 ) 序 偶 组 成 的 关联 表 有 具有 函数 式 的 更 新 
操作 : 简单 地 在 表 前 增加 一 个 新 序 偶而 已 。 更 新 是 很 快 的 ， 但 是 查找 则 需要 费时 的 搜索 。 引 
入 一 个 称 作 向 量 (vector) 的 可 变更 数组 使 查找 相对 快 些 (Aasa 等 ，1988 ) 。 

开始 时 ， 函 数 式 数组 由 一 个 向 量 表示 。 更 新 操作 在 这 个 向 量 前 面 建立 了 一 个 关联 表 ， 用 
以 指出 向 量 的 当前 内 容 和 各 个 数组 值 之 间 的 区 别 。 考 虑 函数 式 数组 4 的 两 个 单元 i 和 j，iz+j， 
Ft ARAL] =u RAY) =v。 现 在 来 进行 一 些 函 数 式 的 更 新 。 将 x 存放 于 位 置 j 从 而 由 A 得 到 8B， 
将 y 存 放 于 位 置 j 从 而 由 B 得 到 C: 
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指向 4、B 和 C 的 其 他 链接 也 显示 出 来 了 ， 这 些 是 来 自 进一步 更 新 所 创建 的 数组 。 这 些 数组 形 
成 了 一 棵 树 ， 称 作 版 本 树 (version tree)， 因 为 它 的 结 点 是 向 量 的 不 同 “ 版 本 ”。 和 通常 的 树 
不 同 ， 它 的 链接 项 是 指向 根 结 点 的 ， 而 不 是 从 根 结 点 指出 去 的 。 树 的 根 结 点 是 4， 这 是 一 个 链 
接 到 向 量 上 的 旺 结 点 。 哑 结 点 只 含有 指向 向 量 的 直接 链接 ， 它 的 作用 是 简化 根 重 整 操作 。 
版 本 树 的 根 重 整 。 虽 然 C 具 有 正确 的 值 ， 也 就 是 CD = x 及 CD = y， 并 且 其 他 值 和 A 一 样 ， 
但 是 对 C 的 查找 可 能 要 比 一 般 情 况 慢 。 如 果 C 是 最 常 使 用 的 向 量 版 本 ， 那 么 版 本 树 的 根 结 点 应 
该 移 到 C。 从 C 出 发 到 向 量 的 那些 链接 项 要 翻转 过 来 ， 并 且 那 些 结 点 所 指出 的 更 新 要 在 向 量 中 
执行 ， 而 先前 向 量 单元 的 内 容 则 被 记录 在 那些 结 点 中 。 





这 个 操作 并 不 影响 函数 式 数 组 的 各 个 值 ， 但 是 查找 4 变 惕 了 ， 而 查找 C 变 快 了 。 哑 结 点 现在 是 
C。 版 本 树 中 引用 A、B 或 C 的 那些 结 点 经 过 了 查找 时 间 的 变化 ， 但 不 是 值 的 变化 。 根 重 整 并 
不 需要 定位 其 他 那些 结 点 。 如 果 没 有 其 他 对 4 或 8 的 引用 ， 那 么 ML 的 存储 分 配器 将 回收 它们 
的 空间 。 

一 种 实现 。 图 8-3 所 示 的 是 一 个 关于 版 本 树 数组 的 ML 结构 声明 ， 简 称 v- 数 组 。 它 匹配 下 面 
的 签名 : 


signature VARRAY = 


sig 

type ‘a t 

val array : int * ‘a -> at 

val reroot : /at-> ‘at 

val sub : ‘at * int -> ‘a 

val justUpdate : ‘at * int * 'a -> ‘at 
val update > ‘at * int * ‘a ->’at 
end; 


不 透明 的 签名 约束 隐藏 了 v- 数 组 的 表示 方法 ， 包 括 相 等 测试 。 内 部 的 相等 测试 只 是 比较 存储 
对 象 的 一 致 性 ， 这 并 不 是 函数 式 的 特性 。 

vy- 数 组 的 类 型 是 a t， 它 有 构造 子 Modif 和 Main。Modif 结 点 (用 于 修改 ) 是 具有 四 个 域 的 
记录 。 存 放 志 数组 的 上 限 是 为 了 进行 下 标 检测 。 其 他 域 是 一 些 引 用 ， 分 别 指向 一 个 索引 、 一 
个 元 素 和 下 一 个 v* 数 组， 这些 域 在 根 重 整 时 会 被 更 新 。Main 结 点 里 包含 了 可 变更 数组 。 

调用 array(n, x) 构 造 出 一 个 v- 数 组 ， 它 由 一 个 向 量 和 一 个 呢 结 点 组 成 。 递 归 函 数 reroo! 完 成 
根 重 整 。 下 标 操作 sub(va, 门 在 节点 中 搜索 下 标 i:， 如 果 需 要 则 在 向 量 中 查找 该 下 标 。 函 数 
justUpdate 只 是 建立 一 个 新 结 点 ， 而 xpdate 则 在 这 个 操作 之 后 紧 接着 对 新 数组 进行 了 根 重 整 。 
库 异常 Subscript 和 Size 可 能 被 显 式 地 抛 出 ， 也 可 能 从 Array 操 作 中 抛 出 。 
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structure Varray :> VARRAY = 
struct 
datatype ‘a t = Modif of {limit : int, 
index : int ref, 
elem : ‘a ref, 
next : ‘at ref} 
| Main of ‘a Array.array; 



























fun array (n,x) = 

if n< 0 then raise Size 

else Modif {limit=n, index=ref 0, elem=ref x, 
next=ref (Main (Array .array(n,x)))}; 





fun reroot (va as Modif {index, elem, next,...}) = 
case !next of 
Main _ => va (* EZER *) 
| Modif _ => 
let val Modif (index=bindex , elem=belem , next=bnext,...} = 
reroot (!next) 
val Main ary = !bnext 
in bindex := ‘index; 
belem := Array.sub(ary, ‘index) ; 
Array . update (ary, ‘index, ‘elem) ; 
next ! bnext; 
bnext va; 
va 








end; 


fun sub (Modif (index, elem, next, .= 
case !next of 
Main ary => Array.sub(ary,i) 
| Modif _ => if ‘index = i then ‘elem 
else sub(!next,i); 








fun justUpdate(va as Modif {limit,...}, i, x) = 

if O<=i andalso i<limit 

then Modif {limit=limit, index= ref i, elem=ref x, next=ref va) 
else raise Subscript; 


fun update(va,i,x) = reroot (justUpdate(va,i,x)); 
end; 


图 8-3 作为 版 本 树 的 函数 式 数组 


程序 通常 都 会 以 单线 索 的 方式 使 用 v- 数 组 ， 在 每 次 更 新 后 丢弃 数组 先前 的 值 。 在 这 种 情况 
下 ， 我 们 应 该 在 每 次 更 新 后 进行 根 重 整 。 如 果 一 个 函数 式 数 组 的 很 多 个 版 本 同时 存在 ， 那 么 
版 本 树 可 能 会 变 得 低 效 ， 因 为 只 有 一 个 版 本 能 用 向 量 表示 。 这 时 ， 我 们 应 当 将 函数 式 数 组 表 
示 为 二 又 树 ， 就 像 在 4.15 节 中 那样 。 另 外 ， 二 叉 树 还 可 以 允许 数组 增长 或 缩短 。 


v- 数 组 的 实验 结果 。 上 面 的 代码 是 基于 Aasa 等 (1988)。 对 于 多 个 单线 索 算法 来 
说 ， 他 们 发 现 v- 数 组 比 其 他 函数 式 数组 的 表示 法 要 更 高 效 。 最 好 的 情况 ，v- 数 组 可 以 
在 常数 时 间 内 完成 查找 和 更 新 ， 尽 管 比 起 可 变更 数组 还 是 要 慢 些 。 基 于 v- 数 组 的 快速 
排序 并 不 比 基 于 表 的 快速 排序 来 得 快 ， 这 暗示 了 数组 应 该 保留 给 需要 随机 访问 的 任 
务 使 用 。 对 于 元 素 的 顺序 处 理 来 说 ， 表 的 效率 更 高 。 
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练习 8.20 回想 3.7 节 中 的 函数 allChange。 在 数组 的 辅助 下 ， 书 写 一 个 可 以 高 效 确定 下 列表 
达 式 值 的 函数 
length (allChange({], [5,2], 16000)); 
练习 8.21 向 结构 Varray 中 添加 销 数 JromList， 实 现 根据 非 空 表 的 内 容 创 建 v- 数 组 。 
练习 8.22 向 结构 Varray 中 添加 函数 copy， 使 得 copy(va) 创 建 一 个 值 和 va 相同 的 新 v- 数 组 。 
练习 8.23 为 二 维 可 变更 数组 声明 一 个 结构 Array2， 其 中 包含 的 组 件 和 Array 的 类 似 。 
练习 8.24 为 二 维 v- 数 组 声明 一 个 结构 Varray2， 其 中 包含 的 组 件 和 Varray 的 类 似 。 
练习 8.25 ” 哑 结 点 中 的 内 容 是 什么 ?其 他 的 v- 数 组 表示 法 能 否 省 去 这 个 结 点 ? 


输入 和 输出 


输入 输出 可 能 是 一 个 令 人 厌烦 的 问题 。 读 取 数 据 和 打印 结果 相对 于 中 间 的 计算 来 说 是 琐 
碎 的 ， 特 别 是 这 些 操作 必须 服从 于 常见 操作 系统 中 的 那些 武断 的 功能 。 输 入 输出 将 安全 、 类 
型 化 的 、 基 本 是 函数 式 的 计算 环境 与 面向 字 节 的 、 命 令 式 的 设备 相 接 。 小 部 分 人 对 ML 定义 中 
仅 描述 了 一 个 很 吝 冀 的 相关 原 语 集 感 到 惊 讨 。Algol 60 的 定义 根本 没有 提 到 输入 输出 。 

ML 库 补 充 了 这 方面 的 不 足 ， 描 述 了 若干 输入 输出 模型 和 数 十 个 操作 。 它 也 提供 了 字符 串 
处 理 函 数 来 对 输入 进行 扫描 ， 对 输出 进行 格式 化 。 我 们 有 选择 地 研究 其 中 一 部 分 。 

像 树 这 样 的 链接 数据 结构 的 输入 输出 造成 了 特殊 的 困难 。 将 它们 摊 平 成 字符 串通 常会 破 
坏 对 于 子 树 的 广泛 共享 ， 导 致 指数 爆炸 。 像 Poly/ML 中 的 那 种 永久 存储 可 以 高 效 地 存放 任意 的 
数据 。 这 种 设施 很 难 找到 ， 而 且 也 缺乏 弹性 。 


8.7 字符 串 处 理 
库 提 供 了 广泛 的 函数 用 于 处 理 字符 串 和 子 串 。 结 构 Int、Real 和 Bool (还 有 其 他 的 ) 包含 


了 在 基本 值 和 字符 串 之 间 进 行 转换 的 函数 。 主 要 的 函数 有 toString、fromString、fmt 和 scan。 


对 于 这 些 函 数 ， 库 在 每 个 适当 的 结构 中 都 声明 了 专用 版 本 ， 而 不 是 在 顶层 重 载 它们 。 你 也 可 
以 在 自己 的 某 些 结构 中 声明 这 些 函 数 。 

转换 成 字符 串 。 国 数 toStrin8g 按 默认 格式 将 它 的 参数 表示 成 一 个 字符 串 : 

Int .toString (~23 mod 10); 

> "7" ; string 

Real . toString Math. pi; 

> "3.14159265359" : string 

Bool .toString (Math.pi = 22.0/7.0); 

> "false" : string 


结构 StringCyr 支 持 更 为 精细 的 格式 化 。 你 可 以 指定 显示 多 少 个 小 数位 ， 以 及 将 结果 字符 串 补 
足 到 需要 的 长 度 。 你 甚至 还 可 以 选择 基数 。 例 如 ，DEC PDP-8 使 用 八进制 记 法 ， 并 将 整数 补 
足 到 四 个 数字 : 

Int .fmt StringCvt.OCT 31; 

> "37" : string 

StringCvt.padLeft #"0" 4 it; 

> *0037" : string 


337 
339 
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像 String.concat 这 样 的 操作 可 以 把 格式 化 的 结果 与 其 他 文本 组 合 在 一 起 。 
将 字符 事 进 行 转换 。 钞 数 JromsString 将 字符 串 转 换 到 基本 的 值 。 这 个 销 数 允许 比较 随意 地 
输入 ， 数 值 的 表示 比 ML 程 序 中 合法 的 那些 要 宽松 得 多 ， 例 如 ， 在 ~ 以 外 ， 也 接受 + 和 一: 


Real .fromString "+.6626e-33"; 
> SOME 6.626E~34 : real option 


对 字符 串 进 行 由 左 到 右 的 扫 找 ， 并 且 忽 略 后 面 多 余 的 字符 。 可 能 检测 不 到 用 户 的 错误 : 


Int toString "1024"; 

> SOME 1 : int option 

Bool. fromString "falsetto"; 

> SOME false : bool option 


KRMATAS AMR, RHEL RRA BH: 


Int .fromString “My master’s mind"; 
> NONE : int option 


分 解 字符 事 。 既 然 fromSiring 忽 上 略 剩 余 的 字符 ， 我 们 又 如 何 将 字符 串 中 的 一 系列 值 转换 出 
来 ? 库 结构 String 和 Substring 为 扫描 提供 了 有 用 的 函数 。 函 数 String.tokens 从 字符 串 中 提取 出 
一 个 词法 单元 列表 。 词 法 单元 是 一 些 非 空 的 子 串 ， 它 们 由 一 个 或 多 个 分 隔 符 隔 开 。 分 隔 符 由 
一 个 类 型 为 char bool 的 谓词 定义 ,结构 Char 中 包含 有 识别 字母 (isAipha)、 空 格 (isSpace) 
和 标点 符号 (isPunct) 的 谓词 。 这 里 有 一 些 调用 例子 : 

String . tokens Char.isSpace 

"What is thy name? I know thy quality."; 

> ["What", “is", "thy", “name?", 

> "I", "know", "thy", "quality."] : string list 

String . tokens Char .isPunct 

"What is thy name? I know thy quality."; 


> ["What is thy name", " I know thy quality"] 
> : string list 


这 样 ， 我 们 就 可 以 将 输入 的 字符 串 分 解 成 它 的 组 成 部 分 ， 然 后 把 它们 传 给 fromSiring 。 函 数 
dateFromString ( 见 图 8-4) 用 于 将 形 如 dd-MMM-yyyy 的 日 期 解码 。 它 以 三 个 横 线 分 隔 的 词法 
单元 作为 输入 ， 利 用 IntfromString 来 分 析 日 和 年 、 用 String.Substring 将 月 缩短 为 三 个 字母 。 如 
果 月 份 找 不 到 ， 或 者 出 现 异常 ， 那 么 函数 返回 NONE， 异 常 Bind 可 能 在 三 个 地 方 出 现 。 

dateFromString "25~OCTOBRE-1415-shall-live-forever"; 

> SOME (25, "OCT", 1415) : (int * string * int) option 

dateFromString "2L-DECX-1805"; 

> SOME (2, "DEC", 18) : (int * string * int) option 
我 们 看 到 dareFromStrin8 就 像 其 他 的 六 omstring 一 样 允 许 随 意 地 输入 。 

从 字符 源 中 扫描 。 在 几 个 库 结构 中 都 可 以 发 现 扫描 函数 scan ， 它 们 提供 对 文本 处 理 的 精 
确 控制 。 这 些 国 数 接受 任意 以 函数 方式 给 出 的 字符 源 ， 而 不 只 是 一 个 字符 串 。 如 果 可 以 书写 
函数 

getc : o> (char x o) option 


那么 类 型 ao 就 可 以 作为 一 个 字符 源 。 调 用 8etc 或 者 返回 NONE ， 再 或 者 返回 下 一 个 字符 和 之 后 
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的 字符 源 所 组 成 的 包 。 


val months = ["JAN", "FEB", "MAR", "APR", "MAY", "JUN", 
"JUL", "AUG", "SEP", "OCT", "NOV", "DEC"]; 


fun dateFromString s = 

let val sday::smon::syear::_ = String.tokens (fn c => c = #"-") s 
val SOME day Int. fromString sday 
val mon String . substring (smon, 0, 3) 
val SOME year Int .fromString syear 
if List.exists (fn m => m=mon) months 
then SOME (day, mon, year) 
else NONE 

end 

handle Subscript => NONE 

| Bind => NONE; 





图 8-4 从 字符 串 中 扫描 日 期 


这 些 scan 函 数 读 入 一 个 基本 值 ， 尽 可 能 地 取 走 字符 ， 并 将 其 余 内 容留 给 后 续 处 理 。 例 如 ， 
我 们 将 表 定 义 为 一 个 字符 源 : 


fun listGetc (x::1) = SOME (x,1) 
| listGete {] = NONE; 


> val listGetc = fn : ’a list -> (‘a * ‘a list) option 


scan 函 数 都 是 柯 里 的 ， 以 字符 源 作为 它们 的 第 一 个 参数 。 整 数 的 scan 消 数 之 前 还 需要 给 定 一 
个 基数 ，DEC 表 示 十 进 制 。 我 们 来 扫描 一 些 带 有 错误 的 输入 : 


Bool.scan listGetc (explode "mendacious"); 

> NONE : (bool * char list) option 多 
Bool.scan listGetc (explode "falsetto"); 
> SOME (false, [#"t", #"t", #"o"]): 
Real .scan listGetc (explode "6.626x-34"); 
> SOME (6.626, [#"x", #"-", #"3", #"4"]) 

> : (real * char list) option 

Int.scan StringCvt.DEC listGetc (explode "1024"); 

> SOME (1, [#"o", #"2", #"4"]) : (int * char list) option 


(bool * char list) option 


打 错 了 的 字符 x 和 o 并 没有 阻止 〈 它 们 前 面 的 ) 数 的 扫描 ， 但 是 这 些 字符 被 留 在 输入 中 。 这 种 
错误 是 可 以 被 检测 出 来 的 ， 方 法 是 查看 输入 是 否 读 完 ， 或 者 接 下 来 的 字符 是 不 是 一 个 期 望 的 
分 隔 符 。 在 后 一 种 情况 下 ， 可 以 跳 过 分 隔 符 ， 接 着 扫描 后 面 的 值 。 

fromSitring 销 数 易于 使 用 ， 但 是 会 漏 掉 一 些 错误 。scan 函 数 则 构成 了 坚固 的 输入 处 理 
基础 。 


练习 8.26 声明 函数 writeCheque， 用 于 打印 支票 上 的 钱 数 。 调 用 writeCheque w (dols, cents) 
应 能 将 元 和 分 的 和 表达 为 正好 具有 宽度 w 的 域 。 例 如 ，writeCheque 9 (57, 8) 应 该 返回 字符 串 
"S$***57.08", 


练习 8.27 ”书写 函数 1oVpper， 用 于 将 字符 串 中 的 所 有 字母 转 成 大 写 ， 其 他 字符 保持 不 变 。 
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341| 《 库 结构 String 和 Char 中 有 相关 的 函数 。) 


343 练习 8.28 重 写 上 面 的 例子 ， 利 用 子 串 代替 字符 列表 作为 字符 源 。( 库 结构 Substring 里 声明 
了 有 用 的 了 国 数 ， 包 括 gerc。 ) 


练习 8.29 利用 scan 函 数 来 编写 扫描 日 期 的 函数 。 它 应 能 接受 一 个 任意 的 字符 源 。( 库 结 构 
StringCvt 里 有 相关 的 函数 。) 


8.8 文本 输入 输出 


ML 最 简单 的 输入 输出 模型 支持 文本 文件 上 的 命令 式 操作 。 流 (stream ) 连接 外 部 文件 
(或 设备 ) 和 程序 以 传输 字符 。 将 输入 流连 接 到 数据 的 生产 者 上 ， 例 如 键盘 ， 可 以 从 中 读 取 字 
符 直 到 该 生产 者 结束 这 个 流 。 将 输出 流连 接 到 数据 的 消费 者 上 ， 例 如 打印 机 ， 可 以 向 它 送 出 
字符 直到 程序 结束 这 个 流 。 

输入 和 输出 操作 都 属于 结构 Text1O， 它 的 签名 实际 上 是 下 面 的 一 个 扩展 : 


signature TEXTJO = 
sig 
type instream and outstream 
exception lo of {name: string, function: string, cause: exn} 


val stdin : instream 

val stdOut : outstream 

val openin : String -> instream 

val openOut : string -> outstream 
val closeln : instream -> unit 

val closeOut : outstream -> unit 

val inputN : instream * int -> string 
val inputLine : instream -> String 

val inputAll : instream -> string 

val looka : instream -> char option 
val endOfStream : instream -> bool 

val output : outstream * string -> unit 
val flushOut : outstream -> unit 

val print : string -> unit 

end; 


下 面 是 这 些 项 的 简单 描述 。 详 见 库 文档 。 

。 输 入 流 具 有 类 型 instream， 而 输出 流 具 有 类 型 outstream。 这 两 个 类 型 都 不 允许 相等 测试 。 
。 异 常 1o 指 示 了 某 个 低级 的 操作 失败 。 它 带 有 受 影响 的 文件 名 、 原 始 的 函数 名 以 及 被 抛 出 

的 原始 异常 。 

。stdIn 和 stdOut 是 标准 输入 输出 流 ， 在 交互 式 会 话 中 ， 它 们 被 连接 到 终端 。 

。openln(s) 和 openOut(s) 创 建 连接 到 文件 的 流 ， 文 件 名 由 s 给 出 。 

。closelIn(is) 和 closeOut(os) 终 止 一 个 流 ， 断 开 它 与 对 应 文件 的 联系 。 之 后 这 个 流 就 不 能 再 

传输 字符 了 。 输 入 流 可 能 会 被 它 对 应 的 设备 终止 ， 例 如 在 遇 到 文件 结束 时 。 

。inputN(is, n) 从 访 is 中 取 走 最 多 n 个 字符 ， 并 将 它们 作为 字符 串 返 回 。 如 果 在 流 关闭 之 前 

所 取出 的 字符 不 足 n 个 ， 那 么 就 只 返回 这 些 字符 。 

。inputLine(is) 从 流 is 中 读 取 下 一 行文 本 ， 并 将 它 作为 一 个 以 换行 结束 的 字符 串 返 回 。 如 时 

流 is 已 经 关闭 ， 那 么 返回 空 串 。 
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e inputAll(is) 读 取 流 is 的 全 部 内 容 ， 并 将 它们 作为 字符 串 返 回 。 通 常 ， 它 是 读 入 整个 文件 ， 
并 不 适用 于 交互 式 的 输入 。 
* lookahead(is) 返 回 下 一 个 字符 ， 如 果 存 在 的 话 ， 它 并 不 从 流 is 中 取 走 该 字符 。 
*endOfStream(is) 当 流 汪 在 结束 符 之 前 没有 更 多 的 字符 时 返回 true (A). 
e output(os, s) 向 流 0s 中 写 入 字符 串 s 中 的 字符 ， 前 提 是 流 尚未 被 关闭 。 
flushOui(os) 向 最 终 的 目的 文件 送出 仍 等 待 于 系统 缓冲 区 中 的 字符 。 
。print(s) 将 字符 串 s 中 的 字符 写 到 终端 上 ， 也 可 以 通过 output 和 flushOuit 来 实现 。 消 数 print 
在 顶层 可 用 。 
上 面 的 输入 操作 可 能 会 阻塞 : 等 待 将 延续 到 需要 的 字符 出 现 或 是 流 被 关闭 。 
假设 文件 Harry 中 存放 了 亨利 五 世 (Henry V) 的 一 些 话 ， 摘 自 他 在 阿 让 库 尔 战 役 
(battle of Agincourt) 之 前 不 久 对 法 国人 说 的 话 : 
My people are with sickness much enfeebled, 
my numbers lessened, and those few I have 


almost no better than so many French ... 
But, God before, we say we will come on! 


(译文 : 我 手下 的 人 ， 有 好 一 些 害 了 病 ， 力 量 大 大 削弱 了 ， 数 目 也 减少 了 ， 而 留 
下 来 的 为 数 不 多 的 人 ， 又 几乎 并 不 比 那 许多 法 国人 高 出 一 筹 …… TEKAL, A 
们 说 了 ， 我 们 是 非 来 不 可 的 。 莎士比亚 《部 利 五 世 》) 
将 infile 作 为 Harry 的 输入 流 。 我 们 看 一 眼 第 一 个 字符 : 


val infile = TextIO .openIn ("Harry"); 

> val infile = ? : TextIO.instream 
TextlO . lookahead infile; 

> SOME #"M" : char option 


调用 lookahead 并 不 会 在 文件 中 前 进 。 但 是 现在 我 们 要 提取 出 十 个 字符 作为 一 个 字符 种， 然后 
读 取 该 行 剩 下 的 字符 。 


TextIO .inputN (infile, 10); 

> "My people " : string 

TextlO .inputLine infile ; 

> “are with sickness. much enfeebled;\n" : string 


调用 input4ll 读 入 文件 剩余 的 部 分 作为 一 个 长 且 难 懂 的 字符 串 ， 然 后 我 们 将 它 输出 到 终端 : 


TextIO .inputAll infile; 

> "my numbers lessened, and those few I have\nalmo# : string 
print it; 

> my numbers lessened, and those few I have 

> almost no better than so many French ... 

> But, God before, we say we will come on! 


最 后 会 发 现 文件 显示 出 我 们 正 处 于 文件 结尾 ， 因 此 要 把 文件 关闭 : 


TextIO . lookahead infile; 

> NONE : char option 
TextIO .inputLine infile; 

> "" : string 

TextIO .closeln ; 
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当 对 流 的 访问 结束 后 关闭 它们 可 以 保存 系统 资源 。 
8.9 文本 处 理 的 例子 


几 个 小 例子 将 演示 怎样 在 ML 中 处 理 文本 文件 。 真 正 进 行 输入 输出 的 代码 量 很 小 ， 有 点 令 
人 感到 意外 ， 而 类 似 String.tokens 的 字符 串 处 理 函 数 却 做 了 大 部 分 的 工作 。 

批 处 理 输入 输出 。 我 们 的 第 一 个 例 程 是 读 入 一 系列 行 并 打印 每 个 单词 首 字 母 。 单 词 是 以 
空格 分 隔 的 词法 单元 ， 通 过 下 标 操 作 可 以 得 到 它们 的 首 字符 ， 并 用 ;mplode 将 首 字 符 连 接 成 一 
个 字符 串 : 


fun firstChar 5 = String.sub(s,0); 
> val firstChar = fn : string -> char 
val initials = implode o (map firstChar) o 
(String . tokens Char .isSpace) ; 
> val initials = fn : string -> string 
initials "My ransom is this frail and worthless trunk"; 
> "Mritfawt" : string 


函数 batchinitials 在 给 定 输入 和 输出 流 时 ， 不 断 地 逐 行 读 取 输入 ， 并 且 将 每 行 的 单词 首 字 符 写 
入 到 输出 流 中 ， 直 到 输入 流 被 读 完 。 


fun batchinitials (is, os) = 

while not (TextiO.endOfStream is) 

do TextlO.output(os, initials (TextlO.inputLine is) ^ “\n"); 
> val batchInitials = fn 


> : TextIO.instream * TextIO.outstream -> unit 
将 zhiie 作 为 全 新 的 Harry 输入 流 ， 对 其 应 用 PatcPyrririals: 


val infile = TextO .openin("Harry"); 

> val infile = ? ; TextIO.instream 
batchInitials (infile, TextlO .stdOut) ; 

> Mpawsme 

> mnlatfIh 

> anbtsmF. 

> BGbwswwco 


输出 显示 在 终端 上 ， 这 是 因为 stdOui 被 指定 为 输出 流 。 

交互 式 输入 输出 。 只 要 将 sidIn 作 为 第 一 个 参数 传人 即 可 使 batchlnitials 从 终端 读 取 字符 。 
但 是 程序 的 交互 式 版 本 应 该 在 暂停 下 来 准备 接受 输入 时 显示 一 个 提示 符 。 一 个 朴素 的 尝试 就 
是 在 调用 jputLine 之 前 调用 ovipxw (输出 提示 符 ): 

while not (TextlO.endOfStream is) 


do (TextlO.output(os, “Input line? "); 
TextlO . output(os, initials (TextIO .inputLine is) ^ "\n")); 


但 是 这 样 会 将 打印 提示 符 延至 读 取 输 入 之 后 。 这 里 有 两 个 错误 : (1) 必须 调用 fiushOut 来 保证 
输出 确实 能 被 显示 出 来 ， 而 不 是 存放 在 缓冲 区 中 。(2) 必须 在 调用 endOfStream 之 前 打印 提示 


符 ， 因 为 那个 芳 数 可 能 会 阻 宕 ， 因 此 必须 将 提示 符 代码 移 至 while 和 do 关键 字 之 间 。 下 面 是 
个 改良 版 本 : 
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fun promptinitials (is, os) = 
while (TextlO.output(os, "Input line? "); 
TextIO . flushOut os; 
not (TextiO.endOfStream is) ) 
ao TextIO.output(os, “Initials: » 


initials (TextlO .inputLine is) ^ "\n"); 
> val promptInitials = fn 
> : TextIO.instream * TextIO.outstream -> unit 


回忆 一 下 ， 对 表达 式 (E1; En .…; E) 求 值 就 是 分 别 依 次 对 E1，E,，..….，E, 求 值 ， 并 返回 E, 的 值 。 
我 们 可 以 在 测试 循环 条 件 之 前 执行 任何 命令 。 在 下 面 的 例子 执行 中 ， 提 供给 标准 输入 (用 户 
键入 ) 的 文本 被 标 上 下 划 线 : 

promptlnitials (TextIO .stdin, TextIO. stdOut); 

> Input line? If we may pass, we will; 

> Initials: Iwmpww 

> Input line? If we be hindered ... 

> Initials: Iwbh. 

> Input line? 
最 后 的 输入 是 Control-D， 它 终止 了 输入 流 。 这 并 不 妨碍 我 们 以 后 继续 从 stdIn 中 读 取 字符 。 类 
似 地 ， 在 过 到 一 个 文件 的 结尾 后 ， 某 个 其 他 进程 可 能 会 扩展 那个 文件 。 调 用 endOfStream 可 能 
会 在 此 时 返回 true( 真 )， 而 稍 后 返回 false (fk). 

如 果 输 出 流 总 是 终端 ， 那 么 使 用 prini 可 以 进一步 简化 while 循 环 : 

while (print "Input line? "; not (TextIO .endOfStream is) ) 

do print ("Initials: ~ ^ initials (TextlO .inputLine is) ^ "\n")j 

转换 到 17TWL。 下 一 个 例子 只 进行 简单 的 输入 输出 ， 重 点 说 明子 串 的 使 用 。 类 型 skbstrin8 
的 值 由 一 个 字符 串 s 和 两 个 整数 i 和 n 表 示 ， 它 代表 了 s 中 从 位 置 开 始 的 n 个 字符 的 段 。 子 串 高 效 
地 支持 特定 形式 的 文本 处 理 ， 其 中 只 有 很 少 的 复制 和 边界 检测 。 一 个 子 串 可 以 被 分 解 成 词法 
单元 ,或 者 将 其 从 左 到 右 进行 扫描 ， 操 作 的 结果 本 身 也 是 子 串 。 

我 们 的 任务 是 将 剧本 由 纯 文本 转换 成 HTML， 它 是 在 互联 网 上 使 用 的 超 文本 标记 语言 。 图 
8-5 显 示 的 是 一 个 典型 的 输入 。 段 落 是 以 空 行 分 隔 的 。 每 句 对 白 自 成 一 段 ; 相应 的 输出 必须 插入 
一 个 <P> 标 记 。 每 段 的 第 一 行 给 出 了 人 物 的 名 称 ， 后 跟 一 个 句号 ; 相应 的 输出 中 必须 把 名 称 用 
标记 <EM> 和 </EM> 括 住 以 突出 强调 。 为 了 保留 断 行 ， 转 换 必须 在 每 段 的 诸 行 后 加 上 <BR> 标 记 。 


Westmoreland. Of fighting men they have full three score thousand. 


Exeter. There's five to one; besides, they all are fresh. 


Westmoreland. O that we now had here 
But one ten thousand of those men in England 
That do no work to~day! 


King Henry V. What’s he that wishes so? 
My cousin Westmoreland? No, my fair cousin: 
If we are marked to die, we are enough 
To do our country loss; and if to live, 
The fewer men, the greater share of honour. 





图 8-5 转换 之 前 的 无 格式 输入 
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函数 firstLine 处 理 每 段 的 第 一 行 ， 将 名 称 和 行 的 余下 部 分 分 离 。 它 使 用 了 库 结构 Substring 
中 的 三 个 组 件 ， 分 别 是 all、splitl 和 string。 调 用 all ?建立 一 个 代表 整个 字符 串 * 的 子 串 。 调 用 
spLi 从 左 到 右 扫描 字符 串 ， 在 name 中 返回 第 一 个 句号 之 前 的 子 串 ， 在 rest 中 返回 原始 串 的 剩余 
部 分 。 调 用 string 将 这 些 子 串 转 换 成 字符 串 ， 以 便 可 以 将 它们 连接 到 其 他 含有 标记 的 字符 串 上 。 
fun firstLine s = 
let val (name,rest) = 
Substring .splitl (fn c => c <> #".") (Substring .all s) 
in "\n<P><EM>" ^ Substring.string name ^ 
"</EM>" ^ Substring . string rest 


end; 
> val firstLine = fn : string -> string 


在 下 面 的 例子 中 观察 标记 的 位 置 : 


firstLine "King Henry V. What’s he that wishes so?"; 

> "\n<P><EM>King Henry V</EM>. What’s he that wishes so?" 

> : string 
BRA htm Cute — EE BET FA. ERED cut, WRK 
转换 一 行 ， 并 监视 是 否 遇 到 段落 的 第 一 行 。 空 字符 串 表 示 输 入 结束 ， 而 空 行 (只 含有 一 个 换 
行 符 ) 则 另 起 一 段 。 其 他 的 行 根据 是 否 为 第 一 行 作出 相应 的 转换 。 程序 输出 转换 好 的 行 ， 并 


fun htmlCvt fileName = 
let val is TextIO .openin fileName 


and os TextIO .openOut (fileName ^ " html") 
fun cvt _ "" = () 
| evt _ "\n" = cvt true (TextlO.inputLine is) 
| cvt firt s = 


(TextIO . output (os, 
if first then firstLine s 
else "<BR>" ^ s); 
cvt false (TextlO.inputLine is) ); 
in cvt true "\n";  TextlO.closeln is; TextlO.closeOut os 
end; 
> val htmlCvt = fn : string -> unit 


最 后 ，htmlCvt 关 闭 输入 输出 流 。 关 闭 输 出 流 将 导致 在 缓冲 区 存放 的 文本 确 确 实 实 的 写 到 文件 
中 去 。 图 8-6 给 出 了 在 浏览 器 中 显示 的 转换 好 的 文本 。 


Westmoreland. Of fighting men they have full three score thousand. 


Exeter. There’s five to one; besides, they all are fresh. 


Westmoreland. O that we had here 
But one ten thousand of those men in England 
That do no work to-day! 


King Henry V. What’s he that wishes so? 

My cousin Westmoreland? No, my fair cousin: 
If we are marked to die, we are enough 

To do our country loss; and if to live, 

The fewer men, the greater share of honour. 





图 8-6 HTML 的 输出 显示 
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回答 入 给 出 和 标准 库 。 另 一 个 有 用 的 结构 是 Bin1O， 它 支持 8 位 字 节 形式 的 二 进 制 
数据 的 输入 和 输出。 字符 和 字 节 并 不 是 一 回 享 : 在 有 些 系统 中 ， 字 符 不 止 8 位 ， 并 且 对 
于 某 些 字符 码 有 特别 的 解释 。 人 例如， 二进制 输入 输出 没 用 换行 的 记 法 。 
&) FImperativelO, StreamlO4ePrimlO & 4 ZRA RAR (RAE MR 
为 可 选 的 ， 但 是 好 一 点 的 ML 系统 都 会 提供 。) ImperativelO £4 BEA HGS ARH, 
Stream10 提 供 了 通 数 式 的 输入 操作 : 读 入 项 并 不 从 输入 流 中 移 除 ， 而 是 产生 新 的 输 
入 流 。PrimlIO 是 最 原始 的 一 层 ， 没 有 缓冲 ， 直 接 以 铝 作 系统 调用 的 方式 实现 。 通 过 
应 用 这 些 函 子 可 以 支持 专门 类 型 的 输入 输出 ， 例 如 扩展 字符 集 。 
Andrew Appel 在 John Reppy 和 Dave Berry 的 帮助 下 设计 了 这 个 输入 输出 接口 。 
练习 8.30 书写 一 个 ML 程序 来 对 一 个 文件 中 包含 的 行 、 单 词 和 字符 进行 计数 。 单 词 是 一 个 以 
空格 、 制 表 符 或 换行 分 隔 的 字符 串 。 
练习 8.31 书写 一 个 过 程 , 提示 输入 一 个 圆 的 半径 ,打印 出 相应 的 圆 面积 (利用 公式 4 =ar), 
并 不 断 重复 这 一 过 程 。 如 果 对 (输入 的 ) 实数 进行 解释 的 尝试 失败 ， 程 序 应 该 打印 一 条 错误 
信息 并 让 用 户 重 试 。 


练习 8.32 <>&" 这 四 个 字符 在 HTML 中 有 特殊 的 含义 。 它 们 在 输入 中 的 出 现 应 当 被 替换 成 
相应 的 转 义 序列 &lt; &gt; &amp; &quot;。 修 改 himlCvi 以 完成 这 个 要 求 。 


8.10 美化 打印 程序 


在 显示 程序 和 数学 公式 时 ， 如 果 通 过 分 行 和 缩 进来 强调 它们 的 结构 ， 那 么 程序 和 公式 会 更 
加 易 读 。4.19 节 的 重 言 式 检测 器 包括 一 个 函数 show， 它 能 将 命题 转换 成 字符 串 ， 如 果 转 换 后 的 
字符 串 过 长 ， 在 一 行内 写 不 下 ， 那 么 我 们 通常 会 看 到 这 样 的 输出 (30 字 符 一 行 的 情况 下 ): 


((((landed | saintly) | ((“lan 
ded) | (~saintly))) & ((("rich 
) | saintly) | ((~landed) | (~ 
saintly)))) & (((landed | rich 
) | (("landed) | (“saintly))) 
& (((“rich) | rich) | ((~lande 
dad) | ("saintly))))) 


图 8-7 的 显示 就 好 多 了 ， 它 是 由 一 个 美化 打印 程序 处 理 后 输出 的 。 两 个 命题 (包括 上 面 那个 ) 
分 别 格 式 化 成 30 和 60 个 字符 一 行 。 找 出 公式 的 最 佳 表 现形 式 需要 判断 力 和 审美 观 ， 不 过 一 个 
简单 的 美化 打印 模式 能 给 出 意 想不到 的 好 结果 。 有 些 ML 系 统 提 供 了 类 似 下 面 讲述 的 那 种 美化 
打印 原 语 。 

美化 打印 程序 接受 一 段 文字 ， 这 些 文字 需要 由 人 嵌 套 信息 来 修饰 ， 并 允许 插入 断 点 。 让 我 
HAREZ (0) BRE. ME (|) 指示 可 能 分 行 的 位 置 。 形 如 〈el en 的 表达 式 称 
为 一 块 (block ) 。 

例如 ， 表 达 式 块 
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表示 了 字符 串 a*b- (c+d) ， 它 人 允许 在 字符 * 、- 和 + 后 面 换行 。 


((~(((~landed) | rich) & 
(~ (saintly & rich)))) | 
((~landed) | (~saintly))) 


((((landed | saintly) | 
((~landed) | (“saintly))) & 
((("rich) | saintly) | 
((~landed) | 
(~saintly)))) & 
(((landed | rich) | 
((“landed) | (~saintly))) & 
((("rich) | rich) | 
((~landed) | (“saintly))))) 


((7(( (landed) | rich) & (~(saintly & rich)))) | 
((“landed) | (“saintly))) 


((((landed | saintly) | (("“landed) | (“saintly))) & 
((("rich) | saintly) | ((~landed) | (“saintly)))) & 

(((landed | rich) | ((~landed) | (“saintly))) & 
((("rich) | rich) | ((~landed) | (“saintly))))) 





图 8-7 美化 打印 程序 的 输出 


当 根据 运算 符 的 优先 级 省 去 括号 时 ， 有 必要 正确 地 处 理 美化 打印 。 表 达 式 块 的 嵌 套 结构 
对 应 于 公式 
(axb)-(c+d) ARIE ax(b-(c+d)) 

如 果 ax*b- (c+d) 在 一 行内 写 不 下 ， 那 么 它 应 该 在 -字符 后 面 断 行 ， 外 层 块 要 先 于 内 层 块 进行 
断 行 。 

美化 打印 算法 跟踪 当前 行 剩 下 的 空格 数 。 当 它 遇 到 断 点 时 ， 它 要 确定 在 同一 块 或 仅 外 层 
块 中 的 下 个 断 点 前 有 多 少 个 字符 。( 这 样 就 会 忽略 内 层 块 中 的 断 点 。) 如 果 当前 行 写 不 下 那么 
多 字符 ， 算 法 则 会 另 起 一 行 ， 并 适当 缩 进 以 和 当前 块 首 对 齐 。 

算法 并 不 要 求 在 每 块 之 后 都 立即 跟随 一 个 断 点 。 在 上 例 中 ， 表 达 式 块 


(e+ | 4) 
紧 跟 的 是 一 个 ) 字 符 ， 所 以 字符 串 d) 不 能 断 开 。 因 此 要 以 某 种 方式 确定 到 下 一 断 点 的 距离 。 
美化 打印 程序 具有 如 下 签名 


signature PRETTY = 
sig 
type t 
val blo : int * t list -> t 
val str : string -> t 
val brk : int -> t 
val pr : TextlO.outstream * t * int -> unit 
end; 





ML ¥ 65 SA AEF K tH 269 


并 提供 比 刚才 所 述 原 语 的 花样 略 多 一 些 : 
。! 是 符号 表达 式 的 类 型 ， 也 就 是 所 说 的 块 、 字 符 串 和 断 点 。 
e bloli, [ei1, …, em) 创建 -一 个 包含 已 知 各 表达 式 的 块 ， 并 指定 当前 的 缩 进 要 增加 i。 这 个 缩 | 
进 信息 将 在 块 被 断 开 时 用 到 。 353 
。str(s) 创 建 一 个 包含 字符 串 s 的 表达 式 。 
*brk() 创 建 一 个 长 度 为 的 断 点 ， 如 果 不 需 要 在 此 断 行 ， 则 换 成 打印 ! 个 空格 。 
。pr(os,e,m) 打 印 表 达 式 e 到 输出 流 o0s 上 ， 以 m 作 为 行 长 。 

图 8-8 给 出 了 美化 打印 程序 。 注 意 Block 里 存 有 由 blo 计 算出 来 的 整个 块 的 大 小 。 另 外 ，after 里 

放 着 从 当前 块 尾 到 下 一 个 断 点 的 距离 。 











structure Pretty : PRETTY = 


struct 
datatype t = Block of t list * int * int 
| String of string 
| Break of int; 
fun breakdist (Block{_,_,len)::es, after) = len + breakdist (es, after) 
| breakdist (String s :: es, after) = size $ + breakdist (es, after) 
| breakdist (Break _ :: es, after) = 0 
| breakdist ({], after) = after; 






fun pr (os, e, margin) = 
let val space = ref margin 








fun blanks n = 











(TextlO .output (os, StringCvt.padLeft #" " n "*"); 
Space := ‘space - n) 















fun newline () = (TextlO.output(os,"\n"); space := margin) 














fun printing ((], _, _) 
-| printing (e::es, blockspace, after) 
(case e of 
Block (bes , indent, len) => 
printing (bes, ‘space-indent, breakdist (es, after) ) 
| String s => (TextlO.output(os,s); space := ‘space - size s) 
| Break len => 
if len + breakdist (es,after) <= !space 
then blanks len 
else (newline(); blanks (margin-blockspace) ) ; 
printing (es, blockspace, after) ) 
in printing((e], margin, 0); newline() end; 


() 


N il 

















fun length (Block(_,_,len)) = len 
| length (String s) = size s$ 
| length (Break len) = len; 









val str = String. and brk = Break; 






fun blo (indent,es) = 
let fun sum ({], k) k 
| sum (e::es, k) = sum(es, length e + k) 
in Block(es, indent, sum(es,0)) end; 
end; 


tow 


图 8-8 美化 打印 程序 
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图 8-7 所 显示 的 输出 是 由 我 们 的 重 言 式 检测 器 经 由 如 下 修正 后 生成 的 : 


local open Pretty 
in 


fun prettyshow (Atom a) = str a 
| prettyshow (Neg p) = 
blo(1, [str"(~", prettyshow p, str")"]) 
| prettyshow (Conj(p,q)) = 
blo(1, [str"(", prettyshow p, str" &", 
brk 1, prettyshow q, str")"]) 
| prettyshow (Disj(p,q)) = 
blo(1, [str"(", prettyshow p, str" |", 
brk 1, prettyshow q, str") ")); 


end; 
> val prettyshow = fn : prop -> Pretty.t 


以 prettyshow 的 结果 作为 参数 调用 Pretty.pr 将 完成 美化 打印 。 
©) 进一步 的 阅读 。 美 化 打印 程序 由 Oppen (1980) 发 起 。Oppen 的 算法 很 复杂 ， 但 
只 需要 很 少 的 空间 ; 它 可 以 处 理 非常 大 的 文件 ， 但 只 需 给 存 几 行 的 文本 。 我 们 的 美 
化 打印 程序 足以 显示 定理 和 其 他 易于 在 内 存 中 存储 的 计算 结果 。Kennedy (1996) 给 
出 了 一 个 绘制 树 的 ML 程序 。 


练习 8.33 举例 说 明 形 如 
e+ Ja) [Cle = eh 


的 块 怎样 才 有 可 能 被 美化 打印 成 在 * 字 符 后 断 行 ， 而 不 是 在 -字符 后 面 断 行 的 。 这 个 问题 有 多 
严重 ?给 出 修改 算法 的 建议 以 纠正 这 一 问题 。 

练习 8.34 ”实现 一 种 新 块 ， 含有 “一 致 断 点 ”: 除非 当前 行 可 以 写 下 整 块 内 容 ， 否 则 所 有 断 点 
都 要 换行 。 例 如 ， 一 致 断 行 下 面 的 语句 





人 if E| then i | else Es) 


if E 
将 产生 then 已 而 不 会 产生 if E then £, 
else E, 
else E, 


练习 8.35 书写 一 个 纯 函 数 式 版 本 的 美化 打印 程序 。 它 必须 返回 一 个 字符 串 列 表 ， 而 不 是 写 
入 一 个 流 。 函 数 式 的 版 本 有 什么 实际 优点 ? 
练习 8.36 Fortran 语 句 
FORMAT (' Input =’, I6, ‘ Output =’, F8.2) 
描述 了 一 行文 本 ， 它 以 字符 串 ' Input = ' 开 始 ， 后 跟 一 个 6 位 字符 的 整数 ， 再 跟 字 符 串 


'Output='， 最 后 跟着 一 个 占用 了 8 个 字符 的 浮 点 ( 实 ) 数 ， 其 中 两 个 数字 在 小 数 点 后 面 。 
一 个 用 Fortran 格 式 写 入 的 文件 可 以 以 同样 的 格式 读 出 。 讨 论 这 种 类 型 的 格式 化 输入 输出 能 否 
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在 ML 中 实现 。 怎 样 来 表示 格式 和 数据 ? 
要 点 小 结 


* 引用 表示 内 存 中 可 变更 的 单元 ， 类 似 过 程式 语言 中 的 变量 和 指针 。 

* 在 ML 中 ， 变 量 不 能 被 更 新 ， 只 有 引用 和 数组 可 以 被 更 新 。 

“为 了 防止 多 态 引 用 导致 运行 错误 ， 在 多 态 的 val 声 明 中 出 现 的 表达 式 必须 是 语法 值 。 
* 循环 数据 结构 ， 例 如 环形 缓冲 区 ， 可 以 利用 引用 来 构造 。 

* 一 个 函数 可 以 利用 命令 式 特性 ， 同 时 表现 为 纯 函 数 式 的 特性 。 

“输入 和 输出 命令 在 程序 和 外 部 设备 间 传 递 字符 。 
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HIS ”书写 和 -演算 的 解释 器 


本 章 综合 了 到 且 前 为 止 所 学 的 全 部 概念 。 作 为 一 个 扩展 的 例子 ， 这 里 给 出 了 一 系列 模块 
来 将 和 -演算 实现 为 一 个 原始 的 函数 式 程序 设计 语言 。 和 -演算 的 项 可 以 被 分 析 、 求 值 并 显示 结 
果 。 当 然 ， 这 个 语言 几乎 不 具备 实用 性 ， 简 单 的 算术 运算 使 用 的 是 一 元 记 法 并 需要 数 分 钟 才 
能 完成 计算 。 然 而 ， 它 的 实现 涉及 了 很 多 的 基本 技术 : 语法 分 析 、 约 束 变量 的 表示 以 及 将 表 
达 式 归 约 到 范式 。 这 些 技术 可 以 应 用 到 定理 证 明和 计算 机 代数 上 。 


本 章 提要 


我 们 将 讨论 语法 分 析 和 两 个 入 -项 解释 器 、 并 回顾 -- 下 入 -演算 。 本 章 包 含 以 下 几 节 ; 

。 涵 数 式 语法 分 析 器 。 一 个 ML 函 子 实现 了 自 顶 向 下 的 递归 下 降 语 法 分 析 。 分 析 器 可 以 通 
过 中 组 操作 符 组 合 在 一 起 ， 这 些 中 缀 操作 符 类 似 于 将 语法 短语 组 合 起 来 的 符号 。 

。 入 -演算 简介 。 这 种 演算 中 的 项 可 以 表示 函数 式 程序 。 它 们 可 以 通过 传 值 调用 或 传 名 调用 
的 机 制 进行 求 值 。 赫 换 的 进行 需要 十 分 小 心 ， 以 避免 变量 名 字 的 冲突 。 

。 在 ML 中 表示 入 -项 。 替 换 、 语 法 分 析 和 美化 打印 将 作为 ML 的 结构 来 实现 

。 作 为 程序 设计 语言 的 入 -演算 。 包 括 无 穷 表 在 内 的 典型 的 函数 式 语言 数据 结构 将 在 入 -演算 
中 进行 编码 。 这 里 还 将 演示 递归 函数 的 求 值 。 


函数 式 语 法 分 析 器 


在 讨论 -演算 之 前 ， 我 们 先 看 看 怎样 书写 函数 式 的 扫描 器 和 语法 分 析 器 。 下 面 讲述 的 语 
法 分 析 器 是 对 上 一 章 美化 打印 程序 的 补充 。 通 过 这 些 工具 ，ML 程 序 可 以 读 写 -项 、ML 类 型 
MEMAR. 
9.1 扫描 或 词法 分 析 | 

语法 分 析 器 基本 不 会 直接 去 操作 字符 串 。 字 符 首先 被 扫描 (scan): 处 理 成 为 词法 单元 
(token)， 例 如 关键 字 、 标 识 符 、 特 殊 符号 和 数字 。 语 法 分 析 器 将 接受 一 个 词法 单元 列表 。 


这 样 的 两 层 方案 简化 了 用 于 分 析 的 文法 。 扫 描 器 以 统一 的 方式 删除 了 空格 、 换 行 和 注释 ， 


让 语法 分 析 器 去 处 理 语法 中 更 为 复杂 的 部 分 。 扫 描 可 以 借助 一 个 有 限 状 态 机 来 进行 ， 这 种 状 
态 机 由 以 字符 为 索引 的 数组 驱动 ， 可 以 运行 得 非常 快 。 对 于 小 规模 的 输入 ， 库 结构 Substring 
中 的 扫描 函数 足以 胜任 了 。 
词法 分 析 器 是 一 个 具有 如 下 签名 的 结构 : 
signature LEXICAL = 
datatype token = Id of string | Key of string 


val scan : string -> token list 
end; 
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词法 单元 是 一 个 标识 符 或 关键 字 。 这 个 简单 的 扫描 器 不 能 识别 数字 。 调 用 scan 将 对 一 个 
字符 串 进行 词法 分 析 ， 并 返回 词法 单元 的 结果 列表 。 

在 对 语言 进行 语法 分 析 之 前 ， 我 们 必须 描述 它 的 词汇 。 为 了 将 词法 单元 归 类 为 标识 符 或 
关键 字 ， 必 须 给 扫描 器 提供 一 个 签名 KEYWORD 的 实例 : 

signature KEYWORD = 

val alphas : string list 
and symbols : string list 
end; 
表 alphas 定 义 了 字母 数字 组 成 的 关键 字 ， 像 "if" 和 "let"， 而 symbols 则 列 出 了 符号 组 成 的 关 
键 字 ， 像 "(" 和 " )"。 这 两 种 关键 字 要 分 别处 理 : 
。 由 字母 数字 组 成 的 字符 串 要 尽 可 能 长 地 扫描 ， 直 到 后 面 跟随 的 不 再 是 字母 或 数字 为 止 。 
当 它 属于 alphas 时 ， 就 被 归 类 为 关键 字 ， 否 则 将 归 类 为 标识 符 。 
。 由 符号 字符 组 成 的 字符 串 要 扫描 到 它 匹配 ;ymbols 中 的 某 个 元 素 ， 或 者 后 面 跟随 的 不 再 
是 符号 字符 为 止 。 它 总 是 被 归 类 为 关键 字 。 例 如 ， 如 果 " ("属于 symbols， 那 么 "((" 将 
被 扫描 成 两 个 " ("词法 单元 ， 如 果 不 属于 symbols 则 作为 一 个 " ( ("词法 单元 。 
函 子 Lexical (图 9-1) 利用 几 个 Substring 中 的 函数 实现 了 这 个 扫描 器 ， 这 些 函 数 包括 : gete, 
splitl、string、dropl 和 all。 函 数 getc 将 一 个 子 串 分 成 它 的 首 字 符 和 后 续 字 符 两 部 分 ， 这 两 部 分 
组 成 了 一 个 序 偶 ， 如 果 该 子 串 为 空 ， 那 么 返回 的 结果 是 NONE 。 在 8.9 节 ， 我 们 见 过 函数 c4 和 
string， 它 们 进行 字符 串 和 子 串 之 间 的 相互 转换 。 我 们 也 见 过 splil， 它 从 左 到 右 扫 描 子 串 ， 将 
子 串 分 成 两 部 分 。 函 数 drop! 与 此 类 似 ， 但 只 是 返回 子 串 的 第 二 部 分 ， 扫 描 器 利用 它 来 略 过 空 
格 和 其 他 非 显 示 字 符 。 库 谓词 Char.isAlphaNum 用 来 识别 字母 和 数字 ，Char.is Graph 用 来 识别 
所 有 的 输出 字符 ， 而 Char.isPunct 是 用 来 识别 标点 符号 的 。 

这 段 代 码 是 直接 且 高 效 的 ， 速 度 可 以 与 常见 的 命令 式 实现 相 媲美 。 虽 然 Substring 中 国 数 
的 表现 是 函数 式 的 ， 但 是 它们 以 递增 索引 的 方式 工作 。 这 比 处 理 字符 列表 要 好 。 

该 函 子 声明 了 函数 member 作 为 内 部 使 用 。 它 不 依赖 于 第 3 章 声 明 的 中 缀 操作 符 mem， 也 不 
依赖 于 任何 标准 库 之 外 的 其 他 顶层 函数 。 这 个 成 员 测 试 专用 于 类 型 string， 因 为 多 态 的 相等 测 
试 会 比较 慢 。 

将 词法 分 析 器 实现 为 一 个 函 子 是 因为 签名 KEYWORD 中 的 信息 是 静态 的 。 在 对 新 的 语言 i 
行 语 法 分 析 的 时 候 ， 我 们 只 需要 改变 关键 字 表 和 特殊 符号 表 即 可 。 将 函 子 应 用 到 某 个 
KEYWORD 的 实例 上 相当 于 将 其 中 的 信息 包装 在 结果 结构 中 。 我 们 当然 也 可 以 将 词法 分 析 器 
实现 为 一 个 柯 里 函数 ， 以 类 似 的 信息 作为 一 个 记录 参数 ， 但 是 这 样 做 会 使 词法 分 析 器 的 类 型 
变 得 复杂 ， 换 来 的 只 是 没有 必要 的 灵活 性 。 
练习 9.1 修改 这 个 扫描 器 来 识别 输入 中 的 十 进 制 数 。 定 义 一 个 新 的 构造 子 Num : integer- 
token 来 返回 扫 找 进来 的 整数 常量 值 。 
练习 9.2 ”修改 这 个 扫描 器 来 略 过 注释 。 括 住 注释 的 符号 ， 例 如 " (*" 和 "*)"， 应 该 作为 组 件 
增添 到 结构 Keyword 中 。 
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functor Lexical (Keyword: KEYWORD) : LEXICAL = 
struct 


datatype token = Key of string | Id of string; 


fun member (x:string, l) = List.exists (fn y => x=y) l; 


fun alphaTok a = 
if member(a, Keyword.alphas) then Key(a) else Id(a); 


(* 扫描 符号 关键 字 *) 
fun symbolic (sy, ss} = 
case Substring .getc ss of 
NONE => (Key sy, ss) 
| SOME (c,ss1) => 
if member(sy, Keyword. symbols) 
orelse not (Char.isPunct c) 
then (Key sy, ss) 
else symbolic (sy ^ String.str c, ssl); 


(* 将 一 个 子 串 扫描 称 为 一 个 词法 单元 表 *) 
fun scanning (toks, ss) = 
case Substring .getc ss of 
NONE => rev toks (* 子 串 结束 *) 
| SOME (c,ss1) => 
if Char.isAlphaNum c 
then (* 标识 符 或 关键 字 *) 
let val (id, ss2) = Substring .splitl Char .isAlphaNum ss 
val tok = alphaTok (Substring . string id) 
in scanning (tok: :toks, ss2) 
end 
if Char.isPunct c 
(* 特殊 符号 *) 
let val (tok, ss2) = symbolic (String.str c, ssl) 
in scanning (tok: :toks, ss2) 
end 
else (* 忽略 空格 、 换 行 、 控 制 字 符 *) 
scanning (toks, Substring.dropl (not o Char.isGraph) ss); 


fun scan a = scanning([], Substring.all a); 
end; 





图 9-1 iP ATF 


9.2 自 项 向 下 的 语法 分 析 套 件 


自 顶 向 下 的 递归 下 降 语 法 分 析 器 非常 像 它 所 分 析 的 文法 本 身 。 对 每 个 语法 短语 都 有 过 程 
与 之 对 应 ， 而 这 些 过 程 的 相互 递归 调用 精确 地 反映 了 那些 文法 规则 。 

这 种 相像 在 函数 式 程序 设计 中 更 为 突出 。 高 阶 函 数 可 以 表示 类 似 短语 连接 、 选 择 短语 和 
短语 重复 这 样 的 语法 操作 。 在 对 中 缀 操作 符 作 出 适当 的 挑选 后 ， 函 数 式 的 语法 分 析 器 可 以 编 
写 得 和 一 套 文法 规则 几乎 完全 一 样 。 但 是 不 要 被 表象 所 迷惑 ， 这 个 程序 具有 自 顶 向 下 语法 分 
析 的 所 有 局 限 性 ， 具 体 来 说 ， 一 个 左 递归 的 《left-recursive) 的 文法 规则 如 
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exp = exp "*" 

会 使 该 语法 分 析 器 进入 死 循环 ! 编译 原理 的 课本 上 有 关于 处 理 这 些 局 限 的 讲述 。 

方案 提要 。 假 设 文法 包含 了 某 一 类 短语 ， 这 类 短语 的 含义 可 以 由 具有 类 型 z 的 值 表示 。 这 
些 短语 的 语法 分 析 器 一 定 是 具有 类 型 

token list T x token list 

的 函数 ,此 后 将 缩写 为 类 型 rphrase。 当 给 语法 分 析 器 一 个 以 有 效 短语 开始 的 词法 单元 列表 时 ， 
它 将 移 除 那些 词法 单元 ， 并 计算 出 它们 的 含义 ， 作 为 一 个 类 型 t 的 值 。 语 法 分 析 器 返回 这 个 含 
义 和 剩 下 的 词法 单元 所 组 成 的 序 偶 。 如 果 词 法 单元 表 没 有 以 有 效 的 短语 开始 ， 那 么 语法 分 析 
器 会 以 抛 出 异常 SyntaxErr 的 方式 拒绝 这 个 表 。 

并 不 是 所 有 具有 类 型 z phrase 的 函数 都 是 语法 分 析 器 。 语 法 分 析 器 只 能 从 词法 单元 表 的 前 
端 移 除 词法 单元 ， 它 不 应 插入 词法 单元 ， 或 是 以 其 他 方式 修改 词法 单元 表 。 

为 了 实现 复杂 的 语法 分 析 器 ， 我 们 将 定义 一 些 基 本 的 语法 分 析 器 和 一 些 用 以 组 合 语法 分 
析 器 的 操作 。 

分 析 基 本 短语 。 普 通 的 语法 分 析 器 能 识别 标识 符 ， 特 定 的 关键 字 、 或 空 短语 。 它 们 从 输 
入 中 最 多 能 移 除 一 个 词法 单元 : 

。 语 法 分 析 器 这 ， 类 型 为 string phrase， 从 输入 中 移 除 一 个 Id 词法 单元 ， 并 将 这 个 标识 符 作 

为 字符 串 返 回 (和 词法 单元 表 的 尾部 配 成 一 个 序 偶 )。 

。 如 果 a 是 一 个 字符 串 ， 则 语法 分 析 器 $a 具有 类 型 string phrase。 它 从 输入 中 移 除 关键 字 词 

法 单元 Key a， 并 返回 ac 和 词法 单元 表 尾 组 成 的 序 偶 。 

。 语 法 分 析 器 emprty 具 有 多 态 类 型 (a list) phrase。 它 返回 [] 和 最 初 的 词法 单元 表 组 成 的 

PPAR. 
IPRA D E RERA ARR ad AC AOA, empty RAE RIN 

选择 短语 。 如 果 ph1l 和 ph2 都 具有 类 型 t+ phrase, BAphi| |ph2 也 具有 这 个 类 型 。 语 法 分 
HFS ph | |ph2 接 受 那些 被 语法 分 析 器 ph1 或 Ph2 所 接受 的 短语 。 当 给 予 一 个 词法 单元 表 时 ， 
这 个 语法 分 析 器 将 其 传递 给 phl1，、 如 果 成 功 则 返回 它 的 结果 、 如 果 ph1 拒 绝 这 个 词法 单元 则 尝 
试 ph2。 

语法 分 析 器 !11ph 和 ph 是 一 样 的 ， 只 是 在 ph 拒绝 词法 单元 时 会 令 整 个 分 析 失 败 、 并 产生 一 
个 错误 信息 。 这 可 以 防止 外 层 的 | | 操作 符 去 尝试 另 一 种 短语 分 析 。 操 作 符 ! 1 通常 用 于 以 特别 
的 关键 字 开 始 的 短语 ， 因 此 没有 其 他 可 选择 的 分 析 方法 ， 另 见 下 面 的 $--。 

连贯 短语 。 语 法 分 析 器 ph1l -- ph2 接 受 一 个 phl 短 语 且 共 后 紧 跟 一 个 ph2 短 语 。 这 个 语法 
分 析 器 传递 给 定 的 词法 单元 表 到 ph1。 如 果 phl 分 析出 一 个 短语 并 返回 (x, toks2)， 则 剩 下 的 词 
法 单元 (1oks2) 会 被 传递 给 ph2。 如 果 ph2 也 分 析出 一 个 短语 并 返回 (y, toks3)， 则 ph1 -- PH2 返 回 
((x, 六 ,ioks3)。 注 意 ，loks3 包 含 了 两 次 分 析 后 剩 下 的 词法 单元 。 如 果 任 一 分 析 器 拒绝 了 它 的 输 
入 ， 则 phl -- ph2 也 是 。 

如 此 一 来 ，phl -- ph2 的 含义 将 是 phi 和 ph2 含 义 的 序 偶 ， 它 适用 于 输入 中 连贯 在 一 起 的 
两 段 。 如 果 ph1 具 有 类 型 phrase ，ph2 具 有 类 型 tphrase ， 那 么 phl -- Ph2 则 县 有 类 型 (fix 
T) phrase. 


操作 符 $-~ 则 涵盖 了 一 个 常用 的 情形 。 语 法 分 析 器 a $-~ ph 和 $a ~- ph 类 似 ， 它 分 析 一 个 
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以 关键 字 词 法 单元 a 开始 的 短语 ， 并 继续 调用 ph。 但 是 它 只 返回 ph 的 含义 ， 并 不 将 其 与 a 组 成 
序 偶 。 还 有 ， 如 果 ph 拒 绝 了 它 收 到 的 词法 单元 ， 那 么 (利用!11) 这 个 语法 分 析 器 会 导致 整个 
分 析 失 败 并 产生 一 个 错误 信息 。 操 作 符 $-- 适 用 于 仅 有 一 个 文法 规则 是 以 符号 a 开始 的 情形 。 

修改 含义 。 语 法 分 析 器 ph >> f 接受 与 ph 相同 的 输入 ， 但 是 当 ph 返 回 (x, toks) 时 ， 它 返回 
(f(x), toks)。 这 样 一 来 ， 在 ph 赋予 含义 x 肝 ， 它 赋予 含义 fx)。 如 果 ph 具 有 类 型 o phrase 且 f 具 有 
类 型 o-T， 则 ph >> fRA T phrase. 

重复 。 为 了 说 明 这 些 操作 符 ， 让 我 们 来 编写 一 个 分 析 算 子 。 如 果 ph 是 任意 一 个 语法 分 析 
器 ， 那 么 repeat ph 将 不 做 分 析 或 重复 地 使 用 ph 进行 分 析 : 


fun repeat ph toks = ( ph -- repeat ph >> (op::) 
|| empty) toks; 
中 缀 操作 符 --、>>、| | 的 优先 级 是 从 高 到 低 的 。repeat 的 函数 体 由 两 个 语法 分 析 器 构成 ， 


它们 经 | | 连接 ， 和 显而易见 的 文法 定义 相似 : Pr 的 重复 或 者 是 一 个 pp 接 一 个 PP 的 重复 ， 或 
者 是 空 。 

语法 分 析 器 ph -- repeat phh E(x, xs), toks), 其 中 x 是 一 个 表 。 操 作 符 >> 应 用 表 的 “构造 ” 
(操作 符 : : ) 将 序 偶 (x, xs) 转 换 为 x :: xs。 在 第 二 行 ，empty 产 生 [] 作 为 空 短语 的 含义 。 简 而 言 
Z, repeat ph 构造 一 个 重复 短语 的 含义 列表 。 如 果 ph 具 有 类 型 r phrase， 则 repeat ph 具有 类 型 


(t list) phrase. 


A 小 心 无 穷 通 归 。repeat 的 声明 能 否 通过 在 两 边 同 时 省 略 Ipks 而 简化 ? 答案 是 否定 
的 一 一 调用 repeat ph 会 立即 产生 一 个 对 repeat ph 的 递归 调用 ,这 是 灾难 性 的 : 


fun repeat phtoks = ph -- repeat ph >> (op::) || empty; 


使 用 形式 参数 loks 是 延迟 对 repeat 画 数 体 求 值 的 一 种 办 法 ， 求 值 将 在 得 到 作为 实际 参 
数 的 词法 单元 表 之 后 进行 ， 正 常 的 话 ， 内 层 的 repeat ph 将 被 给 予 一 个 减 短 了 的 词法 
单元 表 ， 因 此 可 以 终止 。 惰 性 求 值 将 不 需要 这 种 办 法 。 


9.3 语法 分 析 器 的 ML 代码 


关于 操作 符 $--、--、>> 和 | | 的 中 缀 指令 给 它们 赋予 了 适当 的 优先 级 。 确 切 的 数字 是 随 
意 选择 的 ,但 是 $-- 的 优先 级 必须 比 ~- 高 ， 以 便 吸 收 它 左边 的 字符 串 。 另 外 ，>> 的 优先 级 必 
须 比 -- 低 ， 以 便 它 可 以 包括 整个 文法 规则 。 最 后 ，| | 必须 具有 最 低 优 先 级 ， 使 得 它 可 以 将 文 
法 规则 组 合 起 来 。 

infix 6 $--; 

infix 5 --; 

infix 3 >>; 

infix 0 ||; 


这 些 指令 具有 全 局 效果 ， 因 为 它们 是 在 顶层 使 用 的 。 我 们 还 应 该 打开 (open) 含有 分 析 操 作 


符 的 结构 : 复合 名 字 不 能 用 作 中 组 操作 符 。 
函 子 Parsing (图 9-3) 实现 了 这 个 语法 分 析 器 。 函 子 的 声明 使 用 了 基本 形式 ， 只 接受 一 个 
结构 作为 参数 ， 此 处 具体 为 Lex。 它 的 结果 签名 是 PARSE (图 9-2)。 
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signature PARSE = 
sig 
exception SyntaxErr of string 


: token list -> string * token list 
: string -> token list -> string * token list 
: ‘a -> 'b list * ‘a 
: (a -> ‘b) * (‘a -> 'b) -> 'a -> 'b 
: Ua -> 'b * 'c) -> 'a -> 'b * 'c 
: (a -> 'b * 'c) * Ve -> ‘d * 'e) -> 'a -> ('b * 'd) * 'e 
: string * (token list -> ‘a * 'b) -> token list -> ‘a * 'b 
: (a -> 'b * 'c) * (b -> 'd) -> ‘a -> 'd * 'c 
repeat : ('a -> 'b * 'a) -> 'a -> 'b list * 'a 
infixes : 
(token list -> 'a * token list) * (string -> int) * 
(string -> 'a -> 'a -> 'a) -> token list -> 'a * token list 
reader : (token list -> ‘a * 'b list) -> string -> ‘a 





图 9-2 函数 式 语法 分 析 器 的 签名 
你 可 能 会 注意 到 这 个 签名 中 的 许多 类 型 和 上 一 节 给 出 的 不 同 。 类 型 缩写 
a phrase = token list = a x token list 

并 没有 被 用 到 ， 更 重要 的 是 ， 签 名 中 的 某 些 类 型 比 语法 分 析 所 需要 的 更 具 一 般 性 ， 它 们 并 不 
局 限于 词法 单元 表 。 

ML 经 常会 赋予 一 个 函数 比 我 们 预想 的 要 更 为 多 态 的 类 型 。 如 果 在 编写 函 子 之 前 描述 签 
名 一 一 这 是 一 种 规矩 的 软件 开发 模式 一 一 则 会 失去 额外 的 多 态 性 。 在 设计 签名 时 ， 有 时 在 ML 
顶层 进行 查询 ， 看 看 它 所 给 出 的 类 型 是 什么 也 是 有 帮助 的 。 

签名 PARSE 描 述 了 类 型 foken， 以 便 进一步 描述 id 和 其 他 项 的 类 型 。 相 应 地 ，Parsing 将 类 
型 token 声 明 为 和 Lex.token 等 价 。 

函数 reader 将 一 个 语法 分 析 器 包装 起 来 给 外 部 使 用 。 调 用 reader ph a 将 字符 囊 a 扫 描 成 词 
法 单元 ， 并 将 它们 提供 给 语法 分 析 函 数 ph。 如 果 再 没有 词法 单元 剩 下 ， 那 么 reader 就 返回 短语 
的 含义 ， 否 则 它 将 提示 发 生 了 语法 错误 。 . 

分 析 中 组 操作 符 。 函 数 infixes 构 造 了 一 个 语法 分 析 器 来 对 中 缀 操作 符 进行 分 析 ， 它 有 以 下 
参数 : 
e ph 接受 准备 通过 操作 符 组 合 的 原子 短语 。 

。prec_of 给 出 操作 符 的 优先 级 ， 对 于 不 是 中 缀 操作 符 的 关键 字 一 律 返回 -1。 

。apply 将 短语 的 含义 进行 组 合 ，apply a x y 将 操作 符 a 应 用 到 操作 数 x 和 ?7 上。 
作为 结果 的 语法 分 析 器 将 识别 如 下 的 输入 

ph ® ph ® ph © ph @ ph 


并 根据 操作 符 的 优先 级 来 结合 原子 短语 。 它 利用 了 相互 递归 的 函数 over 和 next。 
调用 over k 将 分 析 一 系列 短语 ， 它 们 被 优先 级 大 于 或 等 于 k 的 操作 符 隔 开 。 在 next k (x, 
toks) 中 参数 x 是 前 一 个 短语 的 含义 ， 而 k 则 是 指标 优先 级 。 这 个 调用 所 做 的 是 ， 若 下 一 词法 单 
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元 是 具有 优先 级 k 或 以 上 的 操作 符 a， 诸 词法 单元 将 被 递归 地 由 over(prec_of q) 进 行 分 析 ， 并 且 
它们 的 结果 要 和 x 组 合 起 来 ， 然 后 这 一 结果 以 及 剩 下 的 词法 单元 以 原来 的 优先 级 k 为 指标 被 进 
一 步 分 析 ; 若 下 一 词法 单元 不 满足 上 述 条 件 ， 则 调用 什么 也 不 做 。 








functor Parsing (Lex: LEXICAL) : PARSE = 
struct 
type token = Lex.token; 








exception SyntaxErr of string; 





fun id (Lex.Id a :: toks) = (a,toks) 
| id toks = raise SyntaxErr “Identifier expected"; 


$a (Lex.Key b :: 























toks) = if a=b then (a, toks) 
else raise SyntaxErr a 
| $a _ = raise SyntaxErr "Symbol expected"; 


fun empty toks = ([],toks); 


(phi || ph2) toks = phl toks handle SyntaxErr _ => ph2 toks; 











!! ph toks = ph toks handle SyntaxErr msg => 


raise Fail ("Syntax error: " ^ msg); 

















(phl -- ph2) toks = 
let val (x,toks2) = phl toks 

val (y,toks3) = ph2 toks2 
in ((x,y), toks3) end; 







(ph>>f) toks = 
let val (x,toks2) = ph toks 
in (f x, toks2) end; 


fun (a $-- ph) = ($a -- !!ph >> #2); 











fun repeat ph toks = ( ph -- repeat ph >> (op::) 
|| empty ) toks; 






fun infixes (ph, precof,apply) = 
let fun over k toks = next k (ph toks) 
and next k (x, Lex.Key(a)::toks) = 
if precof a < k then (x, Lex.Key a :: toks) 
else next k ( (over (prec.of a) >> apply a x) toks) 
| next k (x, toks) = (x, toks) 
in over 0 end; 


C 扫描 和 语法 分 析 ， 恰 查 是 否 没有 多 余 的 词法 单元 *) 
fun reader ph a = 
(case ph (Lex.scan a) of 
(x, []) => xX 
—::_) => raise SyntaxErr "Extra characters in phrase"); 







图 9-3 语法 分 析 函 子 


这 个 算法 不 处 理 括号 ， 括 号 应 由 ph 处理 。10.6 节 演示 了 infixes 的 使 用 。 

书写 回溯 的 语法 分 析 器 。 当 某 个 词法 单元 表 不 止 有 一 种 语法 描述 时 ， 语 法 是 有 歧义 的 。 
我 们 的 方法 要 易于 修改 以 使 得 每 个 分 析 函 数 都 能 返回 一 个 成 功 的 结果 序列 〈 情 性 表 )。 检 查 序 
列 中 的 元 素 以 使 回溯 能 在 输入 的 全 部 语法 描述 上 进行 。 

语法 分 析 器 phl -- ph2 用 于 对 紧 跟着 ph2 的 phl 进 行 语法 分 析 ， 并 返回 一 个 由 所 有 可 能 的 
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分 析 方 法 所 组 成 的 序列 。 它 将 ph1 应 用 到 输入 上 ， 得 到 一 个 (x, toks2) 序 偶 的 序列 。 对 该 序列 中 
的 每 一 个 元 素 ， 语 法 分 析 器 都 将 ph2 应 用 到 toks2 上 ， 得 到 一 个 (y, toks3) 序 偶 的 序列 。 最 后 它 将 
返回 所 有 成 功 结果 ((x, y), toks3) 的 序列 。 对 每 个 结果 ， 含 义 (x, y) 是 由 ph1l 和 ph2 所 返回 的 结果 
构成 的 序 偶 。 

语法 分 析 器 返回 一 个 空 序列 来 表示 对 其 输入 的 拒绝 ， 而 不 是 抛 出 异常 。 注意 ， 如 果 ph1 
拒绝 其 输入 ， 或 是 ph2 拒 绝 ph1 的 所 有 结果 ， 那 么 phl -- ph2 将 产生 空 序列 ， 也 就 是 拒绝 它 的 
输入 。 

这 是 一 个 很 有 意思 的 有 关 序 列 处 理 的 练习 ， 但 是 它 具 有 回溯 语法 分 析 器 的 弱点 : 速度 慢 ， 
错误 处 理 能 力 差 。 它 可 能 需要 指数 级 的 时 间 来 分 析 输 入 ， 自 底 向 上 的 语法 分 析 则 要 快 得 多 。 
如 果 输 入 含有 语法 错误 ， 回 漳 语 法 分 析 器 除了 返回 空 序列 以 外 没有 任何 信息 。 我 们 的 语法 分 
析 器 稍 加 修改 就 能 够 对 语法 错误 进行 精确 的 定位 。 修 改 类 型 ioken， 使 得 每 个 词法 单元 都 带 有 
它 在 输入 字符 串 中 的 位 置 ， 并 且 让 !! 在 它 的 错误 报告 中 包含 这 一 信息 。 

回溯 在 定理 证 明 中 是 有 价值 的 。 寻 找 证 明 的 一 个 “策略 ”可 以 表达 为 一 个 以 目标 为 参数 ， 
并 返回 解 序列 的 函数 。 策 略 可 以 组 合 起 来 形成 有 效 的 搜索 过 程 。 下 一 章 将 展示 这 一 技术 ， 它 
和 我 们 处 理 语法 分 析 函 数 的 方式 有 关 ， 
练习 9.3 给 出 语法 分 析 器 ph 的 一 个 例子 ， 使 得 对 于 所 有 输入 ，ph 都 能 成 功 地 完成 语法 分 析 ， 
而 repeat ph 则 是 死 循环 。 
练习 9.4 语法 分 析 树 (parse tree) 是 一 棵 树 ， 它 表示 了 词法 单元 表 在 分 析 之 后 的 结构 。 每 个 
结 点 都 代表 一 个 短语 ， 它 的 分 支 是 构成 短语 的 符号 和 子 短语 。 修 改 我 们 的 分 析 方 法 使 得 它 能 
构造 语 尘 分 析 树 。 声 明 一 个 合适 的 分 析 树 类 型 partree ， 使 每 个 语法 分 析 函 数 都 可 具有 类 型 

token list > partree x token list 
编写 操作 符 | | 、--、iq、$、emprty 和 repeat， 注 意 ，>> 不 再 具有 任何 作用 。 
练习 9.5 ”修改 语法 分 析 方法 以 产生 成 功 结果 的 序列 ， 就 像 上 面 叙述 的 那样 。 
练习 9.6 ”以 过 程式 风格 编写 语法 分 析 方 法 ， 其 中 每 个 分 析 “ 函 数 ” 都 具有 类 型 unit 一 a 并 通过 
删除 词法 单元 来 更 新 指向 词法 单元 表 的 引用 。 过 程式 方案 有 人 缺点 吗 ? 还 是 比 函数 式 方案 要 好 ? 
练习 9.7 修改 签名 PARSE 来 描述 一 个 具有 签名 LEXICAL 的 子 结构 Lex， 取 代 描 述 类 型 1oken， 
使 得 其他 签名 项 可 以 引用 类 型 Lex.token。 相 应 地 修改 函 子 声明 。 
练习 9.8” 当 一 个 表达 式 包 含 多 个 具有 相同 优先 级 的 中 组 操作 符 时 ，infixes 是 将 它们 左 结合 还 
是 右 结 合 ?修改 该 函数 以 实现 相反 的 结合 。 叙 述 一 个 算法 来 处 理 左 结合 和 右 结合 操作 符 的 混 
合 情 况 。 


9.4 例子 : 分 析 和 显示 类 型 


语法 分 析 器 和 美化 打印 程序 主将 通过 ML 的 类 型 文法 进行 演示 。 出 于 举例 的 目的 ，ML 的 类 
型 系统 可 以 通过 放弃 记录 和 元 组 类 型 来 得 以 简化 。 有 两 种 形式 的 类 型 要 考虑 : 

由 类型 构造 子 应 用 到 零 个 或 多 个 类 型 参数 上 而 构成 的 类 型 ， 如 int、bool list 和 和 (@ list) (p 
list)。 这 里 ， 类 型 构造 子 int 被 应 用 到 零 个 参数 上 ，list 被 应 用 到 类 型 boo1 上 ， 而 一 则 被 应 用 到 
了 类 型 a list 和 p Ust 上 。ML 对 大 多 数 类 型 构造 子 采用 后 缀 语法 ， 但 是 ~ 则 具有 中 缀 语法 。 在 
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内 部 ， 这 些 类 型 可 以 被 表示 成 -个 字符 串 和 一个 类 型 表 所 组 成 的 序 偶 。 
一 个 类 型 可 以 仅 由 一 个 类 型 变量 构成 ， 这 个 类 型 变量 由 一 个 字符 串 来 表示 。 我 们 的 类 型 
结构 具有 如 下 签名 : 


Signature TYPE = 
sig 


datatype t = Con of string * t list | Var of string 
val pr : t ~> unit 

val read : string -> t 

end; 


它 描述 了 三 个 组 件 : 

。 数 据 类 型 包含 两 种 形式 的 类 型 ， 类 型 构造 子 Con 和 类 型 变量 Var。 

。 调 用 pr ty 将 在 终端 上 打印 类 型 1y。 

。 国 数 read 将 一 个 字符 串 转换 成 一 个 类 型 。 
我 们 可 以 通过 范 子 来 实现 这 个 签名 ， 其 中 国 子 的 参数 表 会 包含 签名 PARSE 和 PRETTY。 但 是 ， 
一 般 来 说 避免 书写 函 子 会 简单 一 些 ， 除 非 要 多 次 用 到 函 子 。 因 此 让 我 们 给 词法 分 析 器 和 语法 
分 析 器 创建 结构 来 进行 类 型 的 语法 分 析 。 稍 后 将 用 它们 来 实现 和 -演算 。 

结构 LamKey 定 义 了 必需 的 符号 。 结 构 LamLex 提 供 了 针对 于 类 型 和 入 -演算 的 词法 分 析 ， 而 
LamParsing 则 提供 了 语法 分 析 操 作 符 。 


structure LamKey = 
struct val alphas 


[] 
and symbols cham, Mm, MEM, Mae, wen] 


end; 
structure LamLex = Lexical (LamKey) ; 
structure LamParsing = Parsing (LamLex); 
结构 Type (图 9-4) 匹配 签名 TYPE。 为 了 简单 起 见 ， 它 只 处 理 了 -~ 符号， 其 他 的 类 型 构造 子 将 
留 作 练习 。 文 法 相互 递归 地 定义 了 类 型 和 原子 类 型 。 一 个 原子 类 型 或 者 是 一 个 类 型 变量 , 或 
者 是 括号 括 住 的 任何 类 型 


Type = Atom -> Type 


| Atom 


Atom = ' Id 
| ( Type ) 


这 个 文法 将 了 -看 成 是 一 个 中 缀 操作 符 ， 并 且 向 右 结合 。 它 将 'a -> 'b -> 'c 解 释 为 'a -> ('b -> 
'c) ， 而 不 是 (a -> 'b) -> 'c， 因 为 'a -> 'b 不 是 一 个 原子 (Ahitom)。 

结构 里 含有 两 个 local 声 明 ， 一 个 是 关于 语法 分 析 的 ， 另 一 个 是 关于 美化 打印 的 。 每 个 
都 声明 了 相互 递归 的 函数 pp 和 arom， 这 与 文法 相对 应 。 打 开 结 构 LamParsing 使 得 它 的 操作 在 
顶层 可 用 ,要 知道 ， 中 组 指令 是 全 局 的 。 

类 型 的 语法 分 析 。 实 际 上 ， 在 使 用 了 自 顶 向 下 的 语法 分 析 操 作 符 之 后 ， 语 法 分 析 器 中 的 
函数 定义 和 文法 规则 是 完全 一 样 的 。 操 作 符 >> 出 现 了 三 次 ， 它 将 一 个 函数 应 用 到 了 语法 分 析 
器 的 返回 结果 上 。 销 数 typ 通 过 >> 将 makeFun 应 用 到 第 一 条 文法 规则 的 结果 上 ， 将 两 个 类 型 合 
并 成 一 个 函数 类 型 。 在 规则 中 使 用 $-- 可 以 避免 将 第 头 符号 作为 短语 的 组 成 部 分 返回 。 
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structure Type : TYPE = 
struct 


datatype t = Con of string * t list 
| Var of string; 


local (** 请 大分 析 **) 
fun makeFun (tyl,ty2) = Con("->", [tyl,ty2]); 
open LamParsing 
fun typ toks = 


( atom -- “->" $-- typ >> makeFun 
| | atom 


) toks 
and atom toks = 
" ~~ id >> (Var o op”) 
" $-- typ -- $")" >> #1 


val read = reader typ; 
end; 


local (** ifay**) 
fun typ (Var a) Pretty .str a 
| typ (Con(*"->", [tyl,ty2])) Pretty.blo(0, {atom tyl, 
Pretty.str " ->", 
Pretty. brk 1, 


typ ty2)) 
and atom (Var a) Pretty .str a 


| atom ty Pretty.blo(1, [Pretty. str" (", 
typ ty. 


Pretty str") "]); 
in 


fun pr ty = Pretty.pr (TextlO.stdOut, typ ty, 50) 
end 


end; 





图 9-4 分 析 和 显示 ML 类 型 


atom 的 两 个 情形 都 涉及 到 >>， 以 及 两 个 神秘 的 函数 。 对 于 第 一 种 情形 ， 在 分 析 类 型 变量 
'a 期 间 ，>> 将 Var o op “应 用 到 了 序 侦 ("'","a") 上 。 这 个 函数 由 Var 和 字符 串 连 接 函 数 复合 
而 成 ， 它 将 字符 串 连接 成 "'a" 并 返回 类 型 Var " 'a"。 

在 atom 的 第 二 个 情形 中 ， 分析 短 语 (Type) 将 调用 函数 #1， 它 选择 其 参数 的 第 一 个 分 量 。 
这 里 它 接受 (ty," ) " ) 作 为 参数 并 返回 :y。 如 果 我 们 没有 使 用 $-- 来 分 析 左 括号 ， 那 么 我 们 将 需 
要 用 到 更 加 神秘 的 函数 (#2 o #1). 

语法 分 析 程 序 使 用 参数 toks 来 避免 死 循环 (就 像 上 面 的 repea! 一 样 )， 这 也 因为 fun 声 明 必 
须要 有 一 个 参数 。 

类 型 的 美化 打印 。 像 语法 分 析 中 的 那样 ， 同 样 的 相互 递归 对 显示 也 有 效 。 国 数 DyPp 和 atom 
都 会 把 类 型 转换 为 一 个 符号 表达 式 以 用 于 美化 打印 ， 不 过 atom 都 将 它 的 结果 括 在 括号 中 ， 除 
非 结果 只 是 一 个 标识 符 。 括 号 应 当 仅 在 需要 时 出 现 ， 括 号 太 多 反而 令 人 困惑 。 
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结构 Pretty 中 的 函数 blo、str 和 brk 以 典型 的 方式 来 描述 块 、 字 符 串 和 汤 点 。 函 数 atom 调 用 
blo， 并 指定 一 个 字符 的 缩 进 以 将 后 续 的 换行 对 齐 在 左 括 号 之 后 。 函 数 1yp 调 用 blo 时 指定 零 缩 368 
进 ， 因 为 它 不 包含 任何 括号 ， 在 字符 串 " -> "之 后 ， 它 调用 brk 1 来 设 定 一 个 空格 或 换行 。 370 

函数 Pr 输出 到 终端 (输出 流 Text1O.stdOut)， 使 用 50 作 为 行 宽 。 

尝试 一 些 例子 。 我 们 可 以 输入 一 些 类 型 ， 注 意 它们 在 语法 分 析 之 后 的 内 部 表示 (作为 
7ype.! 的 值 )， 并 检查 它们 的 显示 是 否 正确 : 


Type . read" ' a->'b->'c"; 
> Con ("->", [Var "‘a", 


> Con ("->", [Var "b", Var "cc"])])) 
> : Type.t 
Type .pr it; 


> ʻa -> 'b -> 'c 
Type . read" ('a->'b)->'c"; 
> Con ("->", [Con ("->", [Var "‘'a", Var "’b"]), 


-> Var "'ec"]) 
> : Type.t 
Type .pr it; 


> (‘a -> 'b) -> 'c 


我 们 对 于 类 型 的 语法 分 析 是 朴素 的 。 形 如 (Type) 的 字符 串 一 定 要 被 分 析 两 次 。Type 的 第 一 
条 文法 规则 没有 生效 : 在 右 括号 之 后 不 存在 词法 单元 -> 。 第 二 条 文法 规则 成 功 地 将 它 分 析 成 
一 个 原子 。 我 们 是 可 以 修改 文法 来 去 除 原 子 的 重复 出 现 。 


Ol 有 关 语 法 分 析 的 更 多 信息 。LR 语 法 分 析 是 复杂 文法 所 选用 的 分 析 方 法 ， 例 如 程 
序 设计 语言 的 那些 文法 。 这 种 自 底 向 上 的 技术 可 靠 、 高 效 并 且 具 有 普遍 性 ， 它 也 支 
持 很 好 的 错误 恢复 。LR 语 法 分 析 器 不 是 手工 书写 的 ， 而 是 通过 使 用 像 Yacc (yet 
another compiler-compiler, $3: 另 一 个 编译 器 生成 器 ) 这 样 的 工具 生成 的 。 这 个 
工具 接受 一 个 文法 ， 构 造 出 语法 分 析 表 并 将 语法 分 析 器 以 源 代码 的 形式 输出 。 每 条 
语法 规则 都 可 附 以 一 个 语义 动作 (semantic action): 只 要 规则 壬 用 就 执行 代码 。 大 
多 数 语法 分 析 器 生成 程序 都 是 基于 C 语 言 的 。 
ML-Yacc (Tarditi 和 Appel，1994) 使 用 ML 描述 语义 动作 以 及 生成 出 来 的 语法 分 
析 器 。ML-Yacc 的 设置 相当 复杂 ， 但 是 对 于 一 定 规模 的 文法 还 是 值得 考虑 的 。 你 必须 
为 ML-Yacc 提 供 一 个 词法 分 析 器 ， 这 有 既 可 以 通过 手工 书写 ， 也 可 以 使 用 像 ML-Lex 
(Appel 等 ，1994) 的 工具 生成 。 
自 顶 向 下 进行 语法 分 析 的 函数 式 方 案 已 经 为 人 所 知 很 长 时 间 了 。Burge (1975) 
中 有 一 份 最 早 发 表 的 相关 描述 ， 包 括 使 用 情 性 表 来 进行 回 湖 。Reade (1989) 给 出 了 
一 份 更 为 新 式 的 叙述 。Frost 和 Launchbury (1989) 为 一 个 解答 系统 而 使 用 这 种 方法 
来 对 英语 的 一 个 子 集 进行 语法 分 析 。 曾 经 建议 了 !11 和 S$-- 符 号 的 Tobias Nipkow 使 用 
这 个 方案 来 分 析 Isabelle 理 论文 件 。 
Aho#¥ (1986) 相当 好 的 描述 了 词法 分 析 和 语法 分 析 。 它 既 涵 盖 了 这 里 所 实现 的 - 
自 顶 向 下 方案 ， 也 包括 了 以 ML_Yacc 为 基础 的 自 底 向 上 方案 。 


练习 9.9 实现 任意 类 型 构造 子 的 语法 分 析 和 美化 打印 。 首 先 为 ML 的 后 组 语法 定义 一 条 文法 ， 
像 下 面 这 样 
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tc list list (string,int) sum 

(‘a -> ‘b) list ‘a list -> ‘b list 
当 类 型 构造 子 只 有 一 个 参数 并 且 不 涉及 箭头 时 ， 括 号 是 可 选 的 ， 由 此 ，'a->'b 1ist 代 表 
'a->(('b) list), 而 不 是 ('a->'b) list. 
练习 9.10 ”使 用 语法 分 析 原 语 ， 或 使 用 ML-Yacc， 实 现 命 题 一 一 4.17 节 的 类 型 prop 
法 分 析 器 。 


入 -演算 简介 


图 灵机 、 递 归 国 数 和 寄存 器 机 器 都 是 计算 的 形式 模型 。 入 -演算 是 由 丘 奇 (Alonzo Church) 
开发 的 ， 它 是 最 时 的 计算 模型 之 一 ， 也 许 还 是 最 现实 的 。 入 -演算 可 以 表示 序 偶 、 表 .、 树 (其 
至 是 无 穷 的 ) 和 高 阶 函 数 的 计算 。 大 多 数 函 数 式 语言 只 不 过 是 入 -演算 的 一 种 修饰 过 的 形式 ， 

它们 的 实现 也 是 以 入 -演算 理论 为 基础 的 。 

ÉRA (Church's thesis) 断 吉 有 效 可 计算 函数 恰好 是 那些 可 以 在 入 -演算 中 计算 的 函数 。 
因为 “ 有效” 是 一 个 模糊 的 概念 ， 所 以 丘 奇 命 题 无 法 被 证 明 ， 但 是 已 知 和 -演算 和 其 他 计算 模 
型 有 具有 相间 的 计算 能 力 。 在 这 些 模型 中 编写 的 函数 ， 只 要 有 足够 的 空间 和 了 时间， 都 可 以 有 效 
地 计算 ， 尚 未 发 现任 何 可 计算 函数 不 能 在 这 些 模型 下 编写 


9.5 入 -项 和 和 - 归 约 


入 -演算 是 一 种 关于 函数 的 简单 形式 理论 。 它 里 面 的 项 称 为 -项 ， 是 递归 地 从 变量 x, y, z, … 
和 其 他 入 -项 中 构造 出 来 的 。 令 1,u, … 代表 任意 的 和 项， 它们 可 以 具有 以 下 三 种 形式 : 
x ”一 个 变量 
Axt) AA & (abstraction ) 
(tu) ARAM (application) 
HM SEM, PREH, Weak tA (subterm). Pin, y Azz y)) 的 子 项 。 
在 抽象 (x. 中 ， 我 们 称 x 为 约束 变量 (bound variable), yh Bk (body)。 在 ! 中 的 每 个 
x 都 被 抽象 所 约束 。 相 对 地 ， 如 果 有 一 个 变量 ?没有 被 约束 ， 即 如 果 它 没有 被 包含 在 某 种 抽象 
(yn) 的 函数 体内 ， 则 它 是 是 自由 (free) 的 。 例 如 ， 在 (Xz.(Xx.(y x)) 中 x 是 约束 的 ， 而 y 是 自由 
的 。 从 此 以 后 ， 用 a, b,c, .… 表示 自由 变量 。 
约束 变量 的 名 字 是 什么 并 没有 多 大 意义 。 如 果 它 们 在 抽象 中 被 一 致 改名 ， 那么 新 的 抽象 


和 原来 的 基本 上 是 一 样 的 。 这 个 原则 在 数学 中 是 广为人知 的 。 在 积分 [fde h, 变量 a 和 b 
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是 自由 的 ， 而 x 是 约束 的 。 在 乘积 | |，,P(e) 中， 变量 "是 自由 的 ， 而 k 是 约束 的 。 


PRO ORR f， 含 义 是 对 于 所 有 x， 有 fx) = 1。 将 (Nx) 应 用 到 参数 4 上 将 产生 一 项 

是 将 ! 中 所 有 自由 出 现 的 x 赫 换 成 u 而 生成 的 。 我 们 把 这 一 赫 换 的 结果 写成 i[w/x]。 赫 换 涉及 很 
多 细微 之 处 ， 不 过 这 些 留待 后 面 再 讲 。 

入 -转换 。 这 是 一 些 在 保持 和 -项 直观 含义 的 同时 对 它们 进行 生变 换 的 规则 。 转 换 不 应 和 像 x + 
y=y +x 这 样 的 等 式 混淆 ,等 式 是 关于 已 知 算术 运算 的 陈述 。 入 -演算 并 不 关心 已 有 的 数学 对 象 。 
入 -项 本 身 是 对 象 ， 而 和 -转换 则 是 基于 它们 的 符号 变换 。 

最 重要 的 是 -转换 ， 它 通过 将 实际 参数 替换 进 函 数 体 来 变换 一 个 国 数 应 用 : 
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((Ax.t)u) =g tlu/x] 
卡 面 这 个 例子 中 ， 实 际 参数 是 (g a): 
(Ax.((fx)x))(g a)) =~ (f(g a))(g a)) 
下 面 是 一 个 连续 两 次 有 -转换 的 例子 : 
((Az.(Za))(Ax.x)) =s ((Ax.x)a) >g a 
ac- 转换 将 一 个 抽象 中 的 约束 变量 重新 命名 : 
(Ax.t) >a Ay.thy/x]) 
x 上 的 抽象 被 变换 为 ?上 的 抽象 ， 并 且 x 被 替换 成 y。 例 如 : 
(Ax.ax) =a (Ay.ay) 
(Ax.(x(Ay.(y.x)))) Sa (Az.(zAy.(y 2)))) 
两 个 和 -项 如 果 可 以 通过 a- 转 换 (有 可 能 应 用 到 子 项 ) 由 一 个 变换 到 另 一 个 ， 那 么 它们 是 全 等 
的 〈(congruent)。 直 观 上 ， 我 们 可 以 认为 全 等 的 项 都 是 一 样 的 ， 在 需要 的 地 方 随时 对 约束 变量 
重新 命名 。 然 厕 ， 自 由 变量 的 名 字 是 有 意义 的 ， 因 此 a 和 8 是 不 同 的 ， 而 (和 xz.z) 和 (入 y.7) 是 全 等 
记 法 。 储 套 的 抽象 和 应 用 可 以 简写 : 
(Ay (Arg. (on …)) 可 写作 (和 rzxa … Xat) 
Coe (ty ta) ot te) 可 写作 Ct) ta o> th) 
当 一 项 不 包含 在 另 一 项 之 中 ， 或 者 是 一 个 抽象 的 函数 体 时 ， 外 面 的 括号 可 以 省 略 。 例 如 ， 
(x(x (Ay. D 可 写作 入 xx (Ayy x) 

归 约 到 范式 。 归 约 步 又 (reduction step) 1 二 4 通过 对 1 的 任何 一 个 子 项 应 用 6- 转 换 将 1 变 
换 到 ux。 如 果 一 项 不 再 允许 进一步 的 归 约 ， 那 么 它 就 是 一 个 范式 (normal form). Rie 
(normalize) 一 项 意味 着 不 断 应 用 归 约 直到 最 终结 果 是 一 个 范式 。. 

有 些 项 可 以 通过 多 种 途径 归 约 。 撕 奇 - 罗 瑟 (Church-Rosser) 定理 说 明了 从 同一 项 开始 的 
不 同 的 归 约 序列 最 终 将 汇合 到 一 起 。 特 别 地 ， 不 存在 两 个 归 约 序列 会 得 出 不 同 的 《不 全 等 的 ) 
范式 。 项 的 范式 可 以 看 成 是 它 的 值 ， 它 和 归 约 进行 的 顺序 无 关 。 

Bilan, Axa x) (Ayb y) c) 有 两 个 不 同 的 归 约 序列 ， 这 两 个 序列 都 有 相同 的 范式 。 每 步 受 
影响 的 子 项 都 以 下 划 线 标 出 : 

(Ax.ax)(Ay.by)c) = a((ay.by)c) => a(be) 
(Ax.ax)((Ay.by)e) => (Ax.ax)(bc) > a(be) 
有 很 多 入 -项 是 没有 范式 的 。 例 如 ，( 和 Xxx x) (Axx 刁 用 有 -转换 会 变换 回 自身 。 任 何 想 规范 这 一 项 
的 党 试 必然 不 能 终止: 
(xxx Axx x) => (xxx NXXX) SS 


项 :即使 在 某 些 归 约 序列 不 能 终止 的 情况 下 也 可 以 有 范式 。 典 型 情况 是 ，! 包 含 设 有 范式 的 子 项 
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u, MmuAlE RT AAR RAR TT. Plan, VALI FP 
(Ay.a)((AX.xx)(Ax.xx)) > a 

通过 删除 项 (和 x.x x) (Xxx 0) 直接 得 到 了 范式 。 这 对 应 于 函数 的 传 名 调用 : 实际 参数 不 被 求 值 ， 
而 是 直接 替换 进 函 数 体 。 试 图 规范 实际 参数 的 话 将 产生 一 个 不 可 终止 的 归 约 序列 : 

(Ay.a) (Mxxx AxxXX)) => Aya (Mxxx x.x) > 
在 灰 换 进 函 数 体 之 前 先 对 实际 参数 求 值 就 是 对 函数 应 用 进行 传 值 调用 。 在 上 面 的 例子 中 ,应 
用 传 值 调 用 策略 是 得 不 到 范式 的 。 如 果 范 式 存在 ， 那 么 对 应 于 传 名 调用 的 归 约 策略 将 总 能 得 
到 该 范式 。 

你 很 可 能 要 问 ， 和 x.xx 怎 么 会 是 图 数 ? 它 可 以 应 用 于 任何 对 象 上 ， 并 将 该 对 象 应 用 于 自 
S| 在 传统 的 数学 中 ， 一 个 函数 只 能 在 已 有 值 的 集合 上 定义 。 入 -演算 处 理 函 数 的 方式 和 传统 
的 理解 不 同 。° 
9.6 在 替换 中 防止 变量 的 捕获 

必须 小 心地 定义 替换 : 否则 转换 可 能 会 出 错 。 例 如 ， 项 Xx yy x 应 该 表现 得 像 柯 里 函数 一 
样 ， 当 应 用 到 参数 t 和 x 上 时 ， 返 回 w ! 作 为 结果 。 对 于 所 有 的 入 -项 :和 u， 我 们 都 应 有 归 约 

Axyyxtu=> (Ày.yt)u => ut 





而 下 面 的 归 约 序列 显然 是 错 的 : 
Oxry.yx)yb => (y.yy)b => bb 27? 


从 (xz yy x) y 到 和 y.y y 的 B- 转 换 是 不 正确 的 ， 因 为 自由 变量 y 变 成 约 东 的 了 。 这 一 赫 换 捕获 
(capture) 了 该 自由 变量 。 通 过 预先 将 约束 变量 y 重 新 命名 为 z， 归 约 就 可 以 安全 地 进行 


(Axz.zx)yb => (Az.zy)b => by 


一 般 来 说 ， 只 要 x 中 的 自由 变量 不 是 ! 中 的 约束 变量 ， 替 换 !w/x] 就 不 会 捕获 任何 变量 。 

如 果 约 束 变量 由 文字 表示 ， 那 么 替换 有 时 必须 要 重新 命名 ! 中 的 约束 变量 以 避免 捕获 自 
由 变量 。 重 新 命名 是 复杂 的 ， 并 且 可 能 损失 效率 。 我 们 必须 保证 新 名 字 不 会 在 项 的 其 他 地 方 
出 现 。 一 般 都 喜欢 把 新 名 字 起 成 和 旧名 字 相 似 的 ， 像 66620094 这 样 的 变量 名 字 是 不 为 人 乐 
见 的 。 

无 名 表示 法 。 改 变 和 -项 的 表示 可 以 简化 替换 算法 。 一 个 约束 变量 名 字 x 的 作用 只 是 将 每 个 
x 和 约束 它 的 MX 匹 配 起 来 ， 以 便 归 约 可 以 正确 进行 。 如 果 这 些 匹配 可 以 通过 其 他 办 法 完成 ， 那 
么 名 字 就 是 可 以 取消 的 。 

我 们 可 以 利用 抽象 的 媒 套 深度 来 做 到 这 一 点 。 每 个 约束 变量 都 由 一 个 索引 表示 ， 索 引 给 
出 的 是 它 和 约束 它 的 抽象 之 间 的 抽象 数目 。 两 个 入 -项 是 全 等 的 (只 是 在 a- 转 换 下 不 同 ) AB 
仅 当 它们 的 无 名 表示 相等 。 l 

在 无 名 记 法 中 ， 入 符号 后 面 不 跟 变量 名 ,约束 变量 索引 以 数 的 形式 出 现 。 在 和 x.( 和 Ny.x) x 的 

© Dana Scott 构 造 过 一 个 模型 ， 其 中 所 有 的 抽象 ， 包 括 和 x.x x， 都 代表 一 个 函数 .( Barendregt，1984)。 然 而 ， 

本 章 仅 从 纯 语法 的 角度 看 待人 -演算 。 
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汲 数 体 中 第 一 次 出 现 的 x 由 1 表示 ， 因 为 它 被 包含 在 基于 y 的 抽象 中 。 第 二 个 x 没 有 包括 在 任何 
其 他 的 抽象 中 ， 故 表示 为 0。 因 此 ，Xx.(Ay-0 x 的 无 名 表示 是 入 .( 入 .1) 0。 
下 面 这 一 项 的 约束 变量 出 现在 多 个 秽 套 深度 中 : 
和 xx (Ayx y (Az.x y z)) 
WARR YH EMRE: 


在 无 名 记 法 中 ， 三 个 x 分 别 被 表示 为 0、1 和 2: 
入 .0 (入 .10 (入 .2 10)) 
像 抽 象 和 替换 这 样 的 操作 在 无 名 表示 法 中 很 容易 进行 。 对 于 变量 绑 定 来 说 ， 这 是 个 不 错 的 数 
据 结 构 ， 但 却 不 是 一 种 可 读 的 记 法 。 原 有 的 变量 名 应 该 保留 以 备 后 用 ， 以 便 使 用 者 可 以 看 到 |376 
传统 的 记 法 。 
抽象 。 假设: 是 一 个 入 -项 ， 我 们 准备 把 它 构造 成 基于 所 有 自由 变量 x 的 抽象 Xx.t:。 例 如 、 我 
们 将 x Oya x y) 作 为 这 样 的 一 项 ， 它 的 无 名 记 法 是 | 


x(^.a x0) 
要 约束 所 有 的 x， 我 们 必须 将 它们 替换 成 正确 的 索引 值 ， 这 里 分 别 是 0 和 1， 然 后 插入 入 符号 : 
入 .0 (A.a 1 0) 
这 可 以 通过 一 个 以 项 为 参数 的 递归 国 数 来 完成 ， 此 递归 函数 将 会 对 抽象 的 深度 进行 计数 。 每 
个 x 都 被 替换 成 与 其 深度 相等 的 索引 。 
替换 。 为 了 进行 B- 转 换 
(Nx.Du =>, tlu/x] 
必须 对 项 :进行 递归 变换 ， 用 "替换 掉 所 有 的 xz。 在 无 名 记 法 中 ，x 可 能 会 被 表示 为 多 个 不 同 的 索 
引 。 索 引 一 开始 为 0， 随 着 :中 抽象 深度 的 递增 , 例如， 转换 
(Ax.x(Ay.axy))b >, b(Ay.aby) 
在 无 名 记 法 中 变 成 
(A.0(A.a10))b => b(A.ab0) 
我 们 会 看 到 ，x 在 外 野 抽 象 中 具有 索引 0， 而 在 内 层 抽象 中 具有 索引 1。 
对 子 项 (和 x.t) u 进 行 B- 转 换 更 为 复杂 。 实 际 参数 4 可 能 含有 在 外 层 被 约束 的 变量 ， 也 就 是 在 
& 中 没有 抽象 与 之 要 匹配 的 索引 。 这 些 索引 必须 加 上 当前 的 嵌 套 深度 ， 然 后 才能 替换 到 + 中 去 ， 


这 保证 了 它们 之 后 能 引用 相同 的 抽象 。 
例如 ,在 


àz.(àx.x(Ày.x))(a 2) =p Az.az(Ay.az) 377 
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中 ， 有 两 处 要 被 替换 成 实际 参数 az， 其 中 一 个 处 于 和 Xy 的 作用 域内 。 在 无 名 方案 中 ，a z 将 得 到 
两 种 不 同 的 表示 : 
入 .( 和 .0( 和 .1))(a0) =p 入 .GO0( 和 .4 1) 
练习 9.11 规范 下 面 的 项 ， 并 给 出 所 有 的 归 约 序列 
OS FF a))(Ax.x x)(Ay.y)Ay-y))) 
练习 9.12 ”给 出 下 面 每 一 项 的 范式 ， 或 说 明 其 没有 范式 : 
(Af x yf x y)(Au v.u) 
(Axf(x x))Axf(x x)) 
Ax yy NOAXSEF DAS EEEF D) 
(Ax.x xX) AX.X) 
练习 9.13 给 出 下 列 项 的 无 名 表示 : 
Ax y z.x z(y z) 
AX y.(Àz.x y z)y x 
Af Axf(Ay.x x y) Axf NY.X x y)) 
Apxy.pxy)(Axy.y)ab 


练习 9.14 给 出 一 种 入 -项 的 表示 法 ， 在 内 部 用 唯一 的 整数 来 标明 约束 变量 。 给 出 构造 入 -项 和 
进行 替换 的 算法 。 
在 ML 中 表示 入 -项 

基于 无 名 表示 法 ， 在 ML 中 可 以 直接 实现 和 -演算 。 下 一 节 将 给 出 抽象 和 替换 的 ML 程序 ， 
并 将 对 入 -项 进行 语法 分 析 和 美化 打印 。 


我 们 需要 在 7.10 节 中 声明 的 字典 结构 StringDict。 它 允许 我 们 将 任意 信息 和 字符 串 关 联 起 
来 ， 这 里 的 信息 是 指 入 -项 。 我 们 可 以 基于 一 个 已 定义 标识 符 的 环境 (environment) 来 对 入 -项 


进行 求 值 。 
9.7 基本 操作 
378 下 面 是 无 名 表示 法 的 签名 : 
signature LAMBDA = 
sig 
datatype t = Free of string 
| Bound of int 
| Abs of string * t 
| Apply of t * f; 
val abstract : int -> string -> t -> t 
val absList  : string list * t -> t 


val applyList : t * t list -> t 
val subst : int -> t -> t -> t 
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val inst : t StringDict.t -> t -> t 
end; 

数据 类 型 :由 自由 变量 (作为 字符 串 )、 约 束 变量 (作为 索引 )、 抽 象 和 应 用 构成 。 每 个 4bs 结 
点 都 存储 了 约束 变量 的 名 字 以 用 于 显示 打印 。 

调用 abstract i b {将 ! 中 所 有 的 自由 变量 b 都 转换 成 索引 i 〈 或 一 个 更 大 的 索引 ， 一 般 出 现在 
EHR). A= 0， 并 且 结 果 将 马上 被 包 在 一 个 抽象 中 以 匹配 这 个 索引 。 对 1 里 面 的 抽象 
进行 递归 调用 会 有 i > 0 的 情况 。 

调用 absList([x1,…, xz] ,将 建立 抽象 和 cl … xX.1。 

WA AapplyList(t, (uy, ,zj) 将 建立 应 用 Fa … Une 

调用 subst iu i! 将 :中 具有 索引 i 的 约束 变量 灯 换 成 x。 通常 i = 0， 且 1 是 Bb- 转 换 (Xx.?) u 中 的 抽 
象 函 数 体 。 对 :中 的 抽象 进行 递归 调用 时 会 有 i > 0 的 情况 。 所 有 超过 i 的 索引 都 要 减 一 ， 以 对 该 
索引 的 删除 进行 调整 。 

调用 inst env ! 将 复制 +， 并 将 其 中 所 有 在 ery 中 有 定义 的 变量 都 替换 成 它们 的 定义 。 字 典 
env 表 示 一 个 环境 ，inst 则 展开 了 项 中 所 有 的 定义 。 这 一 过 程 称 为 实例 化 (instantiation )。 定 义 
中 可 能 引用 了 其 他 定义 ， 实 例 化 将 持续 到 结果 中 不 再 出 现 已 定义 的 变量 。 

签名 LAMBDA 是 具体 的 ， 暴露 了 所 有 的 内 部 细节 。 许 多 类 型 的 值 都 是 假 的 (improper): 
它们 不 对 应 任何 真实 的 入 -项 ， 这 是 由 于 它们 包含 了 没有 匹配 项 的 约束 变量 索引 。 对 于 任何 i 都 
不 存在 一 个 可 以 表示 为 Bound i 的 (A) 项 。 此 外 ，abstract 返 回 假 项 ， 而 subst 正 好 需要 它们 。 
抽象 的 和 -演算 签名 会 提供 基于 入 -项 自身 的 操作 ， 而 隐藏 它们 的 表示 法 。 

结构 Lambda (图 9-5) 实现 了 这 个 签名 。 函 数 shift 是 私有 的 ， 因 为 它 只 被 subst 所 调用 。 
调用 shift i d u 将 i 加 到 x 中 所 有 满足 j> d 的 没有 匹配 的 索引 jj 上。 起 初 d = 0， 接 着 d 将 在 对 4 中 
的 抽象 进行 递归 调用 时 递增 。 在 将 某 项 wx 替换 进 另 一 项 之 前 ， 任 何 x 中 未 匹配 的 索引 都 需要 
转变 。 


structure Lambda : LAMBDA = 
struct 
datatype t = Free of string 
| Bound of int 
| Abs of string 
| Apply of t * 1; 


(* 在 项 中 将 b 转 换 为 约束 索 51i *) 
fun abstract i b (Free a) if a=b then Bound i else Free a 


.| abstract i b (Bound j) Bound j 
| abstract i b (Abs(a,t)) Abs(a, abstract (i+1) b t) 
| abstract i b (Apply(t,u)) Apply (abstract i b t, abstract i b u); 


(* SPT de *) 

fun absList (bs,t) = foldr (fn (b,u) => Abs(b, abstract 0 b u)) t bs; 
(* tfES STEAM *) 

fun applyList (t0,us) = foldl (fn (u,t) => Apply(t,u)) 10 us; 





图 9-5 入 -项 的 无 名 表示 法 
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(* 将 项 中 的 非 局 部 索引 上 移 i *) 
fun shift O d u =u 
shift i d (Free a) = Free a 
shift i d (Bound j) = if j>=d then Bound(j+i) else Bound j 
shift i d (Abs(a,t)) = Abs(a, shift i (d+1) t) 
shift i d (Apply(t,u)) = Apply(shift i d t, shift i d u); 


(* 在 项 t 中 用 u 赫 换 约束 变量 i *) 
fun subst i u (Free a) 
| subst i u (Bound j) 
if j<i then Bound j (* 局 部 约束 *) 
else if j=i then shift i Ou 
else (*j>i*) Bound (j-1) (* 非 局 部 于 + *) 
| subst i u (Abs(a,t)) = Abs(a, subst (i+1) u t) 
| subst i u (Apply(tl,12)) = Apply(subst i u tl, subst i u 12); 
(* 替换 自由 变量 *) 
inst env (Free a) = (inst env (StringDict . lookup (env,a) ) 
handle StringDict.E _ => Free a) 
inst env (Bound i) Bound i 
inst env (Abs(a,t) ) Abs(a, inst env t) 
inst env (Apply (ti ,t2)) Apply (inst env tl, inst env t2); 


Free a 


| 

| 

| 
end; 





图 9-5 《〈 续 ) 
函数 ins! 只 替换 自由 变量 ， 而 不 替换 约束 变量 。 它 需要 接受 真 和 -项 ， 即 其 中 不 存在 没有 匹 

配 的 索引 。 因 此 ， 它 不 需要 跟踪 嵌 套 的 深度 ， 也 不 需要 调用 sh 态 。 
练习 9.15 ”解释 在 absList 和 applyList 声 明 中 的 折 释 算 子 是 怎样 使 用 的 。 
练习 9.16 ”为 和 -演算 声明 一 个 签名 ,隐藏 它 的 内 部 表示 法 。 它 需要 描述 谓词 以 测试 一 个 入 -项 
是 不 是 一 个 变量 、 抽 象 或 应 用 ， 并 描述 一 些 函 数 来 进行 抽象 和 赫 换 。 勾 勒 出 两 个 具有 这 一 签 
名 的 结构 设计 ， 利 用 两 种 不 同 的 和 -项 表示 法 。 
9.8 入 -项 的 语法 分 析 


为 了 可 以 应 用 语法 分 析 器 和 美化 打印 程序 ， 需 要 为 和 -项 定义 一 个 文法 ， 其 中 包括 嵌 套 抽 
象 和 应 用 的 缩写 形式 。 下 面 的 文法 将 一 般 项 和 原子 项 做 了 区 分 。 我 们 使 用 百 分 号 (8) 来 代表 
入 符号 : 


Term = % Id Id* Term 
| Atom Atom* 
Atom = Id 
| ( Term ) 


注意 ，pprase' 代 表 零 个 或 多 个 phrase 的 重复 。 由 多 个 原子 排 在 一 起 组 成 的 项 ， 例 如 abc 4， 是 
RERA b) c) d) 的 缩写 。 更 为 自然 的 文法 是 定 一 个 短语 类 Applic: 
| Applic = Atom 
| Applic Atom 
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然后 就 可 以 将 Term 里 面 的 4tom htom" 换 成 4Applic。 但 是 Applic 的 第 二 条 文法 规则 是 左 递 归 的 ， 
它 会 使 我 们 的 语法 分 析 器 进入 死 循 环 。 前面 的 文法 就 是 通过 标准 做 法 消除 左 递归 之 后 的 产物 。 

结构 ParseTerm (图 9-6) 用 到 结构 Parse 和 Lambda， 包 括 了 语法 分 析 器 和 入 -项 的 操作 ， 以 
满足 签名 PARSE_TERM: 


signature PARSE_TERM = 
sig val read: string -> Lambda.t end; 
这 个 结构 的 唯一 目的 就 是 对 入 -项 进行 语法 分 析 。 它 的 签名 只 描述 了 一 个 组 件 : 国 数 read， 它 将 


一 个 字符 串 转换 成 一 个 和 -项 。 它 的 实现 是 很 直接 的 ， 利 用 了 结构 Lambda 的 组 件 absList 和 
applyList, 


structure ParseTerm : PARSE.TERM = 
struct 


fun makeLambda ((b,bs),t) = Lambda.absList (b: : 
open LamParsing 


fun term toks = 
( "%" $-- id -- repeat id -- "." $-- term makeLambda 


|| atom -- repeat atom Lambda . applyList 
) toks 


and atom toks = 


( id Lambda . Free 
|| "€" $-- term -- $")" #1 
) toks; 

val read = reader term; 


end; 





图 9-6 入 -演算 的 语法 分 析 器 
练习 9.17 在 函数 makeLambda 中 ， 为 什么 它 的 参数 具有 那样 的 模式 ? 
练习 9.18 对 "%x x.x(%x x.x)" 进 行 语法 分 析 的 结果 是 什么 ? 
9.9 显示 入 -项 


结构 DisplayTerm (图 9-7) 实现 了 和 -项 的 美化 打印 。 它 使 用 了 结构 Pretrmy 和 Lampda (美化 
打印 程序 和 项 操作 )， 并 满足 签名 DISPLAY_TERM: 


signature DISPLAY_TERM = 


sig 
val rename : string list * string -> string 
val stripAbs : Lambda.t -> string list * Lambda.t 
val pr : Lambda.t -> unit 
end; 
这 个 签名 描述 了 多 个 组 件 : 


* rename((a,, =, a,]), a) (在 必要 时 ) BMS (C) 追加 在 4a 之 后 使 它 和 每 个 4a1,…, a 区别 
开 来 。 
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* stripAbs 将 一 个 抽象 分 解 为 它 的 约束 变量 和 函数 体 ， 我 们 会 在 下 面 作 进一步 讲述 .。 

© 调用 pr ! 将 项 :打印 在 终端 上 。. 
即便 是 使 用 无 名 表示 法 ， 约 束 变量 在 显示 项 时 也 可 能 需要 重新 命名 。 范 式 ( 和 xy.x) ?显示 
为 %y' .了 ， 而 不 是 sy .yY。 函 数 stripAbs 和 它 的 辅助 函数 strip 是 处 理 抽 象 的 。 给 定 和 Xx! … xm.1， 
约束 变量 将 被 重新 命名 以 区 别 于 t 中 的 所 有 自由 变量 。 新 的 名 字 将 替换 到 + 中 去 作为 自由 变量 。 
这 样 一 来 项 中 所 有 索引 在 显示 时 就 都 被 消去 了 。 











structure DisplayTerm 
struct 


(* GMA Heit *) 
fun vars (Lambda. Free a) = [ 
vars (Lambda. Bound i) = [] 


: DISPLAY_TERM = 











vars (Lambda .Abs(a,t) ) 

vars (Lambda. Apply (ti, 2) ) 
(* 重新 命名 变量 "a" 以 避免 冲突 *) 
fun rename (bs,a) = 

if List.exists (fn x => x=a) bs then rename (bs, a^ "'") else 4a; 


(* ANBRAT lambda; 返回 约束 变革 名 *) 

fun strip (bs, Lambda.Abs(a,t)) = 
let val b = rename (vars t, a) 
in strip (b::bs, Lambda.subst 0 (Lambda.Free b) t) 
end 

| strip (bs, u) = (rev bs, u); 


vars 1 
vars tl @ vars 12; 















stripAbs t = strip ({).1); 







spaceJoin (b,z) =" " “bb ”7z; 












term (Lambda.Free a) 
| term (Lambda .Bound i) 
| term (t as Lambda.Abs _) 
let val (b::bs,u) = stripAbs -t 

val binder = "$" ~ b ^ (foldr spaceJoin ". " bs) 
in Pretry.blo(0, (Pretty.str binder, term ul) 


Pretty .str a 
Pretty.str "“??UNMATCHED INDEX??" 






How N 









end 
| term 1 = Pretty.blo(0, applic t) 
and applic (Lambda.Apply(t,u)) = applic t @ [Pretty.brk 1, atom wu) 
| applic t = [atom t) 
and atom (Lambda.Free a) = Pretty.str a 
| atom 1 = Pretty.blo(1, (Pretty.str"(", 


term t, 
Pretty. str") "]); 






pr t = Pretty.pr (TextlO.stdOut, term t, 50); 


图 9-7 入 -演算 的 美化 打印 程序 


相互 递归 的 函数 term、applic 和 atom 将 和 -项 准备 好 以 便 进 行 美化 打印 。 自 由 (Free) 变量 
直接 显示 其 名 字 。 约 束 (Bound) 变量 索引 不 应 出 现 ， 除 非 它 没 有 对 应 的 4bs 结 点 (说 明 这 是 
一 个 假 项 )。 对 于 4ps 结 点 ， 约 束 变量 被 重新 命名 ， 然 后 通过 /oldlep 将 其 连 成 一 个 字符 串 ， 以 
空格 隔 开 。Apply 结 点 通过 applic 来 显示 ， 它 对 应 于 上 一 节 提 到 的 文法 短语 Applic。 最 后 ，atom 
要 括 在 括号 中， 单独 的 标识 符 除 外 。 
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练习 9.19 (Ax yx) (Ay.y) 的 范式 将 如 何 显示 ? 修改 DisplayTerm 以 保证 当 显示 一 项 时 ， 在 重合 
的 作用 域 中 不 存在 被 约束 两 次 的 变量 名 。 

练习 9.20 不 用 自由 变量 来 替换 约束 变量 也 可 以 显示 项 ,修改 DisplayTerm 来 保存 变量 约束 列表 ， 
其 中 变量 约束 位 于 包含 当前 子 项 的 各 抽象 中 。 在 显示 项 Bound i 上 时， 在 该 表 中 找到 第 i 个 名 字 


作为 程序 设计 语言 的 和 -演算 


虽然 入 -演算 简单 ， 然 而 对 于 建造 完整 的 函数 式 程序 设计 模型 来 说 已 经 足够 丰富 了 。 像 序 
偶 和 表 这 样 的 数据 结构 可 以 在 传 值 调用 或 传 名 调用 的 求 值 策 略 下 进行 处 理 。 在 对 这 些 问题 进 
行 简单 的 讨论 后 ， 我 们 将 用 ML 来 进行 说 明 。 首 先 必须 做 出 一 些 定义 。 

如 果 ! 可 以 经 由 零 次 或 多 次 归 约 步 又 变换 成 4， 那 么 就 记 为 ! 一 * u。 如 果 u 是 范式 ， 那 么 
1 一 "可 以 看 成 是 对 ! 求 值得 到 结果 wx。 并 不 是 所 有 的 求 值 策略 都 可 以 成 功 地 找到 这 个 范式 。 

如 果 存 在 某 项 & (不 一 定 是 范式 ! ) 使 得 6 一 * MA 及 一 * uw， 那 么 就 记 为 4 =h. WRN = 
5， 那 么 一 旦 范式 存在 ， 两 者 就 具有 同一 范式 。 在 将 范式 看 作 值 的 情况 下 ， = ORR BAM 
具有 相同 的 值 。 

我 们 书写 a= 1 来 表示 “将 a 定义 为 {的 缩写 ”， 其 中 a 是 自由 变量 。 


9.10 入 -演算 中 的 数据 结构 


现在 来 考虑 如 何 对 布尔 值 、 序 偶 、 自 然 数 和 表 编 码 。 下 面 给 出 的 编码 是 随意 的 ， 真 正 重 
要 的 是 这 些 数据 结构 及 其 操作 满足 某 些 标准 性 质 。 对 于 布尔 类 型 的 编码 必须 将 真 从 wwe 和 false， 
以 及 条 件 操作 符 f 定 义 为 和 -项 ， 并 (对 于 所 有 1 和 u) 满足 
if truetu=t 
if falsetu=u 
一 旦 有 了 两 个 不 同 的 真 值 和 条 件 操作 符 ， 我 们 就 可 以 定义 否定 、 合 取 和 析 取 。 类 似 地 ，ML 编 
译 器 可 以 用 任意 的 位 模式 来 表示 true 和 false， 只 要 操作 表现 正确 即 可 。 
布尔 值 。 布 尔 值 可 以 通过 如 下 编码 来 定义 
true = Ax y.x 
false = dx y.y 
if=Apxypxy 
所 需 性 质 很 容易 被 验证 ， 例 如 : 


if true t u = (Àp x y.p x y)truetu 
=> (Ax y.true x y)t u 
=> (Ay.true t y)u 
=> truetu 
=> Aryx) tu 
=> (My.Du 
| 一 上 
这 就 建立 了 iftrue tu = " !， 因 此 有 iftrue tu=t。 
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A. Fah is RGR eae pair (APE PRR) 以 及 投影 函数 fst 和 snd 〈( 用 于 选择 序 偶 
的 分 量 )。 通 常 的 编码 是 


pair=dxyffxy 
fst = Ap.p true 
snd = Ap.p false 


其 中 ，true 和 false 如 前 定义 。 下 面 的 妇 约 和 所 对 应 的 等 式 对 于 所 有 it 和 4 都 成 立 ， 这 一 点 很 容 
易 验 证 : 

fst(pairtu) —>* t 

snd(pair t u) =>* u 


自然 数 。 在 几 个 已 知 的 自然 数 编码 中 ， 丘 奇 的 编码 是 最 典雅 的 。 带 下 划 线 的 数字 0, 1, ..., 
RAHA (church numeral): 


Z=Af xf x) 


n= 三 Af xf"(x) 


这 里 六 OOE FC x)…) 的 编写 。 
SR 


函数 sxc 用 于 计算 一 个 数 的 后 继 ，iszero 用 于 测试 一 个 数 是 否 为 零 : 
suc = Anf x.nf (f x) 
iszero = An.n(Ax.false)true 
下 面 的 归 约 不 难 验证 ， 其 中 4 是 任意 丘 奇数 : 
sucn=>*n+1 
iszero 0 =” true 
iszero(suc n) =>”* false 
丘 奇数 允许 定义 简洁 得 出 奇 的 加 法 、 乘 法 和 指数 运算 : 
add = A 和 mnf xmf(nf x) 
mult = Amnf.m(nf) 
expt =Amnfxnmf x 
这 些 都 可 以 用 归纳 法 来 形式 地 验证 ， 它 们 背后 的 直观 意义 也 是 简单 的 。 每 个 丘 奇数 4 都 是 一 个 
算 子 ， 它 将 一 个 函数 应 用 n 次 。 我 们 看 到 


add mnf x =f"(f"(x)) =f"+"(x), 
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其 他 的 定义 也 可 以 类 似 地 理解 。 
自然 数 编码 还 必须 描述 一 个 前 驱 函 数 pre， 使 得 对 于 所 有 数 & 有 


pre(suc n) =n 


对 于 丘 奇 数 来 说 ， 从 n+l 计 算出 4 是 复杂 的 (也 很 慢 ! )， 给 定 f 和 x， 我 们 必须 找到 某 个 g 和 y， 


Me™" 0y) 中 计算 出 f" (x)。 一 个 合适 的 g 是 一 个 作用 在 序 偶 上 的 函数 ， 它 使 得 g (z, z ) = (fF), 


z) 对 所 有 (z, z ) 都 成 立 ， 则 有 
Bt lox, x) = (Pt (x), f) 


我 们 提取 其 中 的 第 二 个 分 量 。 为 了 将 这 些 形式 化 ， 我 们 定义 prefn 来 构造 8。 然 后 定义 前 驱 函 数 
Pre 和 减法 困 数 sub: 
prefn = Af p.pair(f (fst p)) (fst p) 
pre = Àn f x.snd(n(prefn f)(pair x x)) 


sub = Am n.n prem 


关于 减法 ，sub mn = pre" (m)， 它 计算 了 mw 的 第 n 个 前 驱 。 


表 。 表 是 用 序 偶 和 布尔 值 来 编码 的 。 一 个 以 x 为 首 元 素 ，y 为 表 尾 的 非 空 表 编 码 为 (Jfalse， 


(x,y))。 空 表 ni! 可 以 被 编码 为 (true, true)， 然 而 下 面 的 这 个 定义 更 为 简单 有 效 : 
nil = 入 z.Z 
cons = Ax y.pair false (pair x y) 
null = fst | 
hd = \z.fst(snd z) 
tl = Az.snd(snd 2) 
易于 对 任意 r 和 uw 检查 定 义 的 基本 性 质 : 


null nil =>* true 
null(cons t u) =>* false 
hd(cons tu) =>* t 
tl(cons t u) >* u 
传 名 调用 不 用 对 u 求 值 就 可 将 hd (cons t w) 简 化 为 :， 并 且 可 以 处 理 无 穷 表 。 
练习 9.21 基于 任意 的 布尔 值 编码 ， 定 义 一 种 序 偶 的 编码 。 通 过 将 布尔 值 编 码 为 true = 和 x yy 
以 及 false = 和 x yx 来 演示 你 的 定义 。 
练习 9.22 对 于 任意 的 丘 奇数 各 和 n， 验 证 : 


iszero(suc n) = false 
addmn=m-+n40 
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练习 9.23 ”定义 一 种 自然 数 编码 ， 使 得 它 具 有 简单 的 前 驱 函 数 。 
练习 9.24 定义 一 种 带 标签 的 二 又 树 编码 。 


练习 9.25 书写 一 个 ML 缚 数 numeral， 它 具有 类 型 int 一 Lambda.t， 使 得 对 于 所 有 n20，numeral 
n 都 能 构造 出 丘 奇 数 4。 


9.11 入 -演算 中 的 递归 定义 
存在 一 个 通过 递归 计算 丘 奇 数 阶乘 的 和 -项 fact 
fact n = if (iszero n) 1 (mult n (fact(pre n))) 
存在 一 个 通过 递归 合并 两 个 表 的 入 -项 append 
append z w = if (null z) w (cons(hd z)(append(tl z)w)) 
还 存在 一 个 满足 递归 方程 的 和 -项 inflist 
388 inflist = cons MORE inflist 
它 是 无 穷 表 [MORE, MORE, …] 的 编码 。 
递归 定义 是 借助 于 入 -项 ?来 编码 的 : 
Y = 和 .Nxf (x x))Axf( x)) 
虽然 7 背后 的 构思 是 降 涩 难 懂 的 ， 但 是 一 个 简单 的 计算 就 可 以 验证 Y 对 于 所 有 入 -项 f 满足 不 动 
点 性 质 (fixed point property ) 
Yf=f(Yf) 
我 们 可 以 利用 这 一 性 质 来 不 断 地 展开 递归 对 象 的 函数 体 。 定 义 
fact = Y(Ag n.if (iszero n) \ (mult n (g(pre n)))) 
append = Y(Ag z w.if (null z) w (cons(hd z)(g(tl z)w))) 
inflist = Y(Ag.cons MORE g) 
在 每 个 定义 中 ， 出 现 的 递归 都 由 Y Og. .…) 中 的 约束 变量 g 来 替换 。 我 们 来 验证 inflist 的 递归 方 
程 ， 其 他 的 与 此 类 似 。 第 一 行 和 第 三 行 由 定义 可 知 成 立 ， 而 第 二 行 则 用 到 了 不 动 点 性 质 : 
inflist = Y(Ag.cons MORE 8) 
= (Ag.cons MORE g)(Y(Ag.cons MORE g)) 
= (Ag.cons MORE g)inflist 
= cons MORE inflist 
用 7 编写 的 递归 函数 在 传 名 调用 归 约 下 可 以 正确 地 执行 。 如 要 使 用 传 值 调用 归 约 ， 则 递归 函数 
必须 使 用 另 一 种 不 动 点 算 子 (我 们 将 在 下 面 讨论 ) 来 编写 ， 否 则 执行 将 无 法 终止 。 
9.12 入 -项 的 求 值 
结构 Reduce (图 9-8) 实现 了 传 名 调用 和 传 值 调用 的 归 约 策略 。 它 的 签名 是 REDUCE: 
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signature REDUCE = 
sig 
val eval : Lambda.t -> Lambda.t 
val byValue : Lambda.t -> Lambda.t 
val headNF : Lambda.t -> Lambda.t 
val byName : Lambda.t -> Lambda.t 
end; 


签名 描述 了 四 个 求 值 函数 : 
。eval 使 用 类 似 ML 的 传 值 调 用 策略 对 项 进行 求 值 。 它 的 结果 不 必 是 范式 。 
。byValue 用 传 值 调用 来 规范 项 。 
。headNF 将 项 归 约 为 首 范式 (head normal form ) ， 关 于 首 范 式 我 们 将 在 后 面 讨论 。 
。byName 用 传 名 调用 来 规范 项 。 


structure Reduce : REDUCE = 
struct 


fun eval (Lambda .Apply<tl,t2)} = 
(case eval tl of 
Lambda. Abs(a,u) => eval(Lambda.subst O (eval 12) u) 


; | ul => Lambda .Apply(ul, eval t2)) 
| eval t ; 


fun byValue t 

and bodies (Lambda.Abs(a,t) ) 
bodies (Lambda. Apply (ti , t2) ) 
bodies t 


bodies (eval t) 

Lambda.Abs(a, byValue t) 
Lambda . Apply (bodies tl, bodies t2) 
t; 


t un H H 


headNF {Lambda .Abs(a,t)) = Lambda.Abs(a, headNF t) 
headNF (Lambda. Apply(tl,t2)) = 
(case headNF tl of 
Lambda .Abs(a,t) => headNF (Lambda .subst 0 12 t) 
| ul => Lambda.Apply(ul, 12)) 
headNF t =t; 


byName t 

args (Lambda .Abs(a,t)) 
args (Lambda .Apply (tl, t2) ) 
args t 


args (headNF t) 

Lambda .Abs(a, args t) 
Lambda . Apply (args tì, byName t2) 
t; 


nou ow tt 





图 9-8 入 -项 的 归 约 


传 值 调用 。 在 ML 中 ， 对 抽象 fn x => E 求 值 并 不 会 导致 对 E 求 值 ， 因 为 在 x 值 未 知 的 情况 
下 ,通常 没有 方法 来 对 E 求 值 。 我 们 经 党 利用 ML 对 抽象 的 处 理 ， 通 过 书写 fn () => E 来 延迟 
对 E 的 求 值 。 这 允许 一 定 程度 的 惰性 求 值 。 

入 -演算 的 情况 是 不 同 的 。 抽 象 Xx.( 和 Ny.a y) x 可 以 妇 约 为 范式 Nx.a x， 而 不 需要 理会 x 是 否 有 
值 。 即 便 如 此 ， 不 去 简化 抽象 的 函数 体 是 有 好 处 的 。 因 为 这 允许 对 求 值 延 时 ， 就 像 在 ML 里 一 
样 。 这 是 处 理 递 归 所 必需 的 。 

函数 eval, 给 定 应 用 ti h, RERA u, 对: 求 值得 到 w2。( 假设 这 些 求 值 过 程 可 以 终止 。) 
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如 果 u 是 抽象 x.x， 那 么 eval 将 以 u[u2/x] 为 参数 调用 自身 ， 来 将 参数 值 起 换 进 函数 体 ; 如 果品 
是 别 的 什么 ， 则 eval 返 回 4 心 。 若 给 定 一 个 抽象 或 者 变量 ，eva! 将 原封 不 动 地 返回 它 的 参数 。 
虽然 eval 进 行 了 归 约 的 大 部 分 工作 ， 它 的 结果 可 能 包含 不 是 范式 的 抽象 。 

byValue 借 助 eval 来 将 项 归 约 为 范式 。 它 对 其 参数 调用 eval!， 然 后 递归 地 扫描 结果 ， 以 便 规 
范 其 中 的 抽象 。 

假设 1 等 于 true。 当 eval 的 参数 是 if tu ww 时 ， 它 将 对 wu 和 wu 两 者 都 求 值 ， 尽 管 只 有 是 必需 
的 。 如 果 这 是 一 个 递归 函数 的 函数 体 ， 那 么 它 将 永远 运行 下 去 ， 就 像 在 2.12 节 中 所 讨论 的 那 
样 。 我 们 应 该 插入 抽象 来 延迟 求 值 。 选 择 任意 的 变量 x， 并 将 条 件 表达 式 编写 为 

(if t Ax.u1) (Ax.u2)) x 


给 定 这 一 项 ，eva! 将 返回 入 x. 司 作为 tf 的 结果 ， 并 将 它 应 用 于 x。 因 此 它 只 会 对 局 求 值 ， 而 不 会 对 
lz 求 值 。 如 果 ! 等 于 jalse， 则 只 会 对 心 求 值 。 在 传 值 调用 下 ， 条 件 表 达 式 只 能 以 这 种 方式 编写 。 
用 7 编写 的 递归 定义 在 传 值 调 用 下 会 失败 ， 因 为 对 了 的 求 值 永远 也 停 不 下 来 。 可 以 插入 抽 
象 到 Y 中 去 ， 以 便 延迟 求 值 。 算 子 
YV = Af.Axf(ay.x x y))(AxfAy.x x y)) 
也 具有 不 动 点 性 质 ， 并 且 可 以 表示 用 byVYzlxe 求 值 的 递归 男 数 。 
传 名 调用 。 一 个 入 -项 是 首 范式 ， 需 满足 对 于 m > 0 和 n>0， 有 如 下 形式 : 
AX]. Xm Xli... tn 
变量 x 可 以 是 自由 的 也 可 以 是 被 约束 的 x1,…, Xn 之 一 )。 
可 以 看 出 该 项 的 范式 (REE) 必定 是 
AX... Xm XU... Un 
其 中 是 t 的 范式 (i = 1,…, n)。 首 范式 描述 了 项 的 外 在 结构 ， 它 不 会 受 归 约 影响 。 我 们 可 以 
首先 计算 项 的 首 范式 ， 然 后 递归 地 规范 子 项 i:,…, t,， 以 达到 规范 整 项 的 目的 。 如 果 存 在 范式 ， 
这 一 过 程 最 终 会 得 到 范式 ， 因 为 所 有 具有 范式 的 项 也 具有 首 范式 。 
例如 ， 项 和 x.a ((Xz.z) 加 是 首 范式 ， 而 它 的 范式 是 Xx.a x。 不 是 首 范式 的 项 可 以 被 看 成 
AX]... Xm. (ÀX.t) th... th 


其 中 n > 0。 它 允许 在 函数 体 的 最 左 测 进行 一 次 归 约 。 例 如 ， 对 于 所 有 项 :，(Xx yy x) RMA 
为 首 范 式 和 Ny.y t。 很 多 没有 范式 的 项 却 有 首 范式 ， 例 如 
Y = Mf(YN) 
个 别 项 ， 例 如 (xx x) (和 xx x)， 其 至 没有 首 范式 。 这 样 的 项 可 以 被 认为 是 无 定义 的 。 
函数 headNF 通 过 递归 地 计算 headNF 来 计算 项 ti 1 的 首 范式 ， 之 后 ， 若 结果 是 一 个 抽象 
就 进行 一 个 6- 转换 。 参 数 5 在 替换 之 前 不 会 进行 归 约 ， 这 是 传 名 调用 。” 


函数 byName 是 通过 计算 项 的 headNF ， 然 后 规范 最 外 层 应 用 的 参数 来 规范 项 的 。 它 以 适当 
的 效率 完成 了 传 名 调用 归 约 。 


© headNF 利 用 了 Barendregt (1984) 中 的 命题 8.3.13: 如 果 r uv 是 首 范式 ， 那 么 ! 也 是 首 范式 。 
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练习 9.26 证 明 YVf=f (Ay.YV fy). 

练习 9.27 推导 出 YY 的 一 个 首 范式 ,或 者 说 明 不 存在 首 范 式 。 

练习 9.28 推导 出 inflist 的 一 个 首 范式 ,或 者 说 明 不 存在 首 范式 。 

练习 9.29 推导 出 byValue 和 byName 是 怎样 计算 fst (pair tw) 的 范式 ，t 和 和 uu 为 任意 入 -项 。 


9.13 演示 求 值 程序 


为 了 演示 入 -演算 的 实现 ， 我 们 建立 了 环境 stdEnv。 它 定义 了 布尔 值 、 序 偶 等 在 入 -演算 中 的 
编码 (图 9-9)。 结 构 StringDict 的 函数 Insert 要 将 一 个 定义 加 入 到 字典 中 的 条 件 是 该 字符 串 尚 未 
在 其 中 定义 。 











fun insertEnv ((a,b),env) = 
StringDict insert (env, a, ParseTerm.read b); 


val stdEnv = foldl insertEnv StringDict . empty 









[ (* 布尔 *) 
("true", "%x y.x"), ("false", "$x y.y"), 
("if", "tp x y. pxy"), 
(* 序 偶 *) 
("pair", "%x y f.f x y"), 
("fst", "%p.p true"), ("snd", "%p.p false"), 
(* 自然 数 *) 








("suc", "sn f x. n f (f x)"), 
("iszero", "tn. n (%x.false) true"), 







("0", "$f x. x"), ("1", "suc 0"), 
("2", “suc 1"), ("3", "suc 2"), 
("4", "suc 3"), ("5", "suc 4"), 
("6", "suc 5"), ("7", "suc 6"), 
("8", "suc 7"), ("9", "suc 8"), 


("add", "$m n f x. mf (n f x)"), 

("mult", "$m n f. m (n £)"), 

("expt", "%m n f x. nm f x"), 

("prefn", "%$f p. pair (f (fst p)) (fst p)"), 








("pre", "tn f x. snd (n (prefn f) (pair x x))"), 
("sub", "%m n. n pre m"), 

(* # *) 
("nil", "%z.z"), 


("cons", "%x y. pair false (pair x y)"), 
("null", "fst"), 
("hd", "%z. fst(snd z)"), ("tl", "%z. snd(snd z)"), 
(* 传 名 调用 的 递归 *) 
("Y", "$f. (%x.f(x x)) (%x.f (x x})"), 
("fact", "Y(%g n. if (iszero n) 1 (mult n (g (pre n))))"), 
("append", "Y(%g z w.if (null z) w (cons (hd z) (g(tl z)w)))"), 
("inflist", "Y(%z. cons MORE z)"), 
(* 传 值 调用 的 递归 *) 
("YV", "SE. (x. £(%y.x x y)) (%x.f(%y.x x y))"), 
("factv", 
"yy (%g n. (if (iszero n) (%y.1) (%y.muit n (g (pre n))))y)") 
1; 













图 9-9 构造 标准 环境 
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图 数 stdRead 读 入 一 项 ， 并 根据 ?tdEny 进 行 实例 化 ， 展 开 其 中 的 定义 。 注 意 ，"2 "将 展开 
成 很 大 的 项 ， 是 从 suc (suc 0) 推 导出 来 的 : 


fun stdRead a = Lambda. inst stdEnv (ParseTerm.read a); 
> val stdRead = fn : string -> Lambda.t 
DisplayTerm .pr (stdRead "2"); 

> (@n f x. nf (Ff x)) 

> ((%n fx. nf (f x)) (%f x. x)? 


这 一 项 可 以 进行 规范 。 我 们 定义 函数 1ry 使 得 try evjn 读 入 一 项 ， 对 其 应 用 evfn， 并 显示 结果 。 
通过 传 值 调用 ， 我 们 将 "2 "规约 为 一 个 丘 奇 数 : 


fun try evfn = DisplayTerm.pr o evfn o stdRead; 

> val try = fn : (lambda.t->lambda.t) -> string -> unit 
try Reduce. byValue "2"; 

> %f x. f (f x) 


传 值 调 用 可 以 进行 简单 的 丘 奇数 算术 运算 : 24+3=5, 2x3=6, 2=8: 


try Reduce .byValue “add 2 3°; 

> f x. f (f (f (£ (£ x)))) 

try Reduce .byValue "mult 2 3"; 

> gf x. f (£ (£ (£ (£ (£ x))))) 

try Reduce .byValue "expt 2 3"; 

> Sf x. f (£ (£ (£ (£ (£ (£ (£ x))))))) 


环境 中 定义 了 facrVv， 它 是 用 YV 编 码 的 递归 阶乘 函数 ， 并 使 用 抽象 来 延迟 对 if 参数 的 求 值 。 它 
可 以 在 传 值 调用 归 约 下 执行 ， 计 算出 3! = 6: 


try Reduce.byValue "factV 3"; 
> $f x. f (£ (£ (£ (£ (f x))))) 


传 名 调用 归 约 除 可 以 完成 传 值 调用 能 完成 的 计算 外 ， 还 能 完成 更 多 的 计算 。 它 能 处 理 涉及 7 和 
if WBE LT, REARS RE RRA. Pi, BER (append) KIFARE, 
THEE WELLY: 


try Reduce .byName 
"append (cons FARE (cons THEE nil)) (cons WELL nil)"; 
> $f. f (x y. y) 
> ($f. f FARE 
> (@f. £ ($x y. y) 
> ($f. f THEE 
> (af. £ ($x y. y) 
> ($f. £ WELL (%z. z)))))) 


让 我 们 提取 无 穷 表 [MORE, MORE, …] 的 首 元 素 : 

try Reduce.byName “hd inflist*; 

> MORE 
执行 极其 缓慢 ， 特 别 是 使 用 传 名 调用 时 。 计 算 fact 3 需要 330 毫 秒 ， 相 比 之 下 factV 3 只 需 60 毫 
秒 。 计 算 fact 4 需要 40 秒 ! 这 一 点 儿 也 不 奇怪 ， 因 为 算术 使 用 的 是 一 元 记 法 ， 递 归 又 是 通过 复 
制 来 进行 的 。 尽 管 这 样 ， 我 们 也 已 经 具备 了 函数 式 程序 设计 的 所 有 元 素 。 
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再 加 一 点 努力 我 们 就 可 以 得 到 真正 的 函数 式 语言 了 。 取 代 在 纯 入- 演算 中 编写 数据 结构 的 
做 法 ， 我 们 可 以 将 数 、 算 术 操 作 和 序 偶 作 为 原 语 。 为 了 在 一 个 抽象 机 器 上 执行 和 项， 我 们 可 
以 对 其 进行 编译 而 不 是 进行 解释 。 对 于 传 值 调用 归 约 来 说 ，SECD 机 器 是 适合 的 。 对 于 传 名 调 
用 归 约 ， 我 们 可 以 将 和 -项 编译 为 组 合子 ， 并 通过 图 归 约 来 执行 。 设 计 和 实现 一 个 简单 的 函数 
式 语言 是 一 个 有 挑战 性 的 项 目 。 


|@| 进一步 的 阅读 。M. J.C. Gordon (1988) 从 计算 机 科学 家 的 角度 讲述 了 入 -演算 ， 
他 讨论 了 数据 的 表示 方法 ， 并 给 出 了 归 约 和 转换 入 -表达 式 的 Lisp 代 码 。Barendregt 
(1984) 是 入 -演算 的 一 个 全 面 的 参考 。Boolos 和 Jeffrey (1980) 介绍 了 可 计算 性 理论 ， 
包括 图 灵机 、 寄 存 器 机 器 和 广义 递归 函数 。 

N. G. de Bruijn (1972) 开发 了 入 -演算 的 无 名 记 法 ， 并 用 于 他 的 AUTOMATH 系 
统 (Nederpelt 等 ，1994)。 它 也 被 用 于 Isabelie (Paulson, 1994) 和 第 10 章 的 定理 证 


明 机 Hal。 
FieldfeHarrison (1988) 讲述 了 基本 的 组 合子 归 约 。 新 式 的 情 性 求 值 实现 使 用 了 393 
更 为 成 熟 的 技术 (Peyton Jones, 1992), 395 


练习 9.30 “try Reduce.byName 到 下 面 的 字符 串 上 时 将 得 到 什么 结果 ? 


"hd (tl (Y (%z. append (cons MORE (cons AND nil)) 2z)))" 
"hd (tl (tl (Y (%g n. cons n (g (suc n))) 0}))" 


要 点 小 结 


。 自 顶 向 下 的 语法 分 析 可 以 通过 高 阶 函 数 自然 地 表示 。 

。 入 -演算 是 一 个 计算 的 理论 模型 ， 它 与 函数 式 程序 设计 非常 类 似 。 

* 变量 约束 的 无 名 表示 法 易于 在 计算 机 上 实现 。 

。 数 和 表 这 样 的 数据 结构 ， 以 及 它们 的 操作 都 可 以 编写 为 和 -项 。 

* 入 -项 Y 通 过 重复 复制 来 对 递归 进行 编码 。 

。 对 于 入 -演算 来 说 ， 存 在 传 值 调用 求 值 策略 和 传 名 调用 求 值 策略 。 396 





第 10 章 策略 定理 证 明 机 


ML 原先 是 为 实现 定理 证 明 机 (爱丁堡 LCF) 而 设计 的 程序 设计 语言 。 因 此 一 本 关于 ML 

的 书 以 讲述 一 个 定理 证 明 机 而 结束 是 合适 的 。 这 个 定理 证 明 机 称 为 Hal， 源 自 LCF。SHal 通 过 
从 证 明 的 目标 开始 反 向 逐步 求 精 来 构造 证 明 。 从 最 简单 的 方面 看 ， 这 是 证 明 检 测 : 每 一 步 ， 
都 有 一 条 推理 规则 和 目标 进行 匹配 ,将 其 简化 成 某 些 子 日 标 。 如 果 要 证 明 一 些 有 意义 的 东西 ， 
更 多 的 方面 需要 自动 化 。Hal 提 供 策略 (tactic) 和 策略 算 子 (tactical)， 它 们 构成 了 一 种 表示 
搜索 过 程 的 高 级 语言 。 几 个 基本 策略 通过 深度 优先 搜索 的 策略 算 子 加 以 应 用 ， 可 以 实现 一 个 
一 般 性 的 策略 ， 该 策略 能 够 自动 证 明 许 多 定理 ， 例 如 : 

Ix. Yy. px, y) < =y, y)) 

ay. px, y) > Wxy.b(x, y) 

Ax. Vyz. (0) > Yz) 一 (Go > ya) 


从 纯粹 的 能 力 上 讲 ，Hal 不 能 和 专门 的 定理 证 明 机 相 比 。Hal 辆 牲 了 能 力 来 换取 一 些 灵活 性 。 
一 个 典型 的 妇 结 定理 证 明 机 支持 带 相等 的 纯 古 典 逻辑 ， 但 是 没有 归纳 。 策 略 定理 证 明 机 允许 
在 几乎 任意 逻辑 中 使 用 自动 和 交互 式 的 混合 工作 方式 。 

Hal 可 用 于 古典 逻辑 是 由 于 它 广为人知 ，Hal 也 可 以 容易 地 扩展 到 推理 、 模 态 算 子 、 集 合 
论 或 其 他 方面 。 需 要 改变 它 的 策略 以 反映 新 的 推理 规则 ， 策 略 算 子 保持 不 变 ， 随 时 可 以 表示 
Bt HS eR AD RI Fee 


本 章 提要 


本 章 包 含 以 下 几 节 : 

* 一 阶 运 辑 的 相继 式 演算 。 这 里 简要 勾勒 了 一 阶 逻 辑 的 语义 ， 并 讲述 了 相继 式 演算 。 量 词 
推理 涉及 了 参数 和 元 变量 。 

*。 在 ML 中 处 理 项 和 公式 。 一 阶 逻 辑 的 Hal 表 示 借 鉴 了 前 面 章 节 的 技术 。 一 项 主要 的 新 技术 


时 
是 合 一 。 


“策略 和 证 明 状 态 。Hal 将 相继 式 演算 实现 为 一 套 在 证 明 状 态 的 抽象 类 型 上 的 变换 。 每 条 
推理 规则 都 作为 一 个 策略 。 
。 搜 索 证 明 。 用 户 界 面 比较 粗糙 ， 不 过 可 以 演示 策略 。 策 略 算 子 为 策略 增添 了 控制 结构 ， 
并 被 用 来 给 一 阶 逻 辑 编写 自动 策略 。 

一 阶 逻 辑 的 相继 式 演算 
我 们 从 一 阶 逻 辑 的 简单 介绍 开始 。 一 阶 逻辑 的 语法 已 经 在 6.1 节 给 出 。 命 题 远 辑 


四 ”Hal 是 以 亭 利 五 世 王 命名 的 ， 他 是 -- 个 出 色 的 战术 家 。 


397 
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(propositional logic) 只 关心 由 连接 词 A、V 、” 、 一 入 构成 的 公式 。 一 阶 逻 辑 引 入 了 量 
词 Y 和 3， 以 及 变量 和 项 。 一 阶 语言 (first-order language) 在 逻辑 符号 的 基础 上 补充 了 某 些 常 
量 a, b, o. ARITE fg, … 和 谓词 符号 P,Q@, …。 令 办 炒 ,X,… 代 表 任意 公式 。 

全 域 (universe) 是 一 个 非 空 集 合 ， 它 包含 了 项 的 所 有 可 能 值 。 常 量 表示 全 域 中 的 元 素 ， 
冰 数 符号 表示 全 域 中 的 函数 ， 谓 词 符号 表示 全 域 中 的 关系 。 结 构 (structure) 定义 了 一 阶 语言 
的 语义 ， 它 描述 了 一 个 全 域 ， 并 给 出 了 常量 、 浮 数 符号 和 谓词 符号 的 解释 。ML 结 构 类 似 于 逻 
辑 结构 。 

公式 的 含义 取决 于 公式 中 自由 变量 的 值 。 赋 值 (assignment) 是 从 自由 变量 到 全 域 元 素 的 
一 个 映射 。 给 定 一 个 结构 和 一 个 赋值 ， 每 个 公式 或 为 真 或 为 假 。 公 式 Vx.g 为 真 当 且 仅 当 对 于 
所 有 可 能 赋 给 zx 的 值 y 都 为 真 (保持 其 他 变量 不 变 )。 连 接 词 由 真 值 表 定 义 ， 例 如 ，YJA Vy 为 真 当 
且 仅 当 % 为 真 且 V 为 真 。 

有 效 的 公式 是 指 在 所 有 结构 和 赋值 下 都 为 真 的 公式 。 由 于 存在 无 穷 多 个 结构 ， 因 此 不 能 
用 穷尽 测试 去 证 明 一 个 公式 是 有 效 的 。 我 们 可 以 通过 基于 推理 规则 的 形式 证 明 来 证 明 公式 的 
有 效 性 ， 推 理 规则 的 正确 性 是 由 逻辑 语义 保证 的 。 每 条 规则 接受 零 个 或 多 个 前 提 并 产生 一 个 
结论 ， 一 条 合理 的 规则 在 前 提 有 效 的 情况 下 会 产生 有 效 的 结论 。 一 套 关于 逻辑 的 推理 规则 称 
为 证 明 系 统 或 形式 化 。 

在 众多 古典 一 阶 逻 辑 的 证 明 系统 中 ， 最 容易 自动 化 的 是 相继 式 演 算 (sequent calculus). 
表 方 法 有 时 用 于 自动 化 一 阶 逻 辑 ， 是 相继 式 演 算 的 一 种 紧凑 记 法 。 

10.1 命题 逻辑 的 相继 式 演算 
为 了 简单 起 见 ， 让 我 们 暂时 将 注意 力 放 在 命题 逻辑 上 。 一 个 相继 式 具 有 如 下 形式 
Ql., Ọm Wis... Wn 
其 中 四 …, 加 和 i, …, 由 ,是 公式 的 多 重 集合 。 如 第 6 章 所 述 ， 多 重 集合 是 一 个 顺序 无 关 紧 要 的 
元 素 集 。 传 统 上 相继 式 包 含 的 是 公式 表 ， 而 逻辑 中 有 一 些 规 则 是 用 于 交换 表 中 相 邻 公式 的 ， 
多 重 集合 可 以 省 去 这 些 规则 。 

给 定 一 个 结构 和 赋值 ， 上 面 的 相继 式 为 真 当 且 仅 当 公 式 身 ,， …, 各 中 有 些 为 假 ， 或 公式 

poen 如 中 有 些 为 真 。 换 句 话 说， 这 个 相继 式 和 下 面 的 公式 含义 相同 
DIA AGm > WV Vn 
作为 一 个 特别 情形 ，F 4% 的 含义 和 y 相 同 ， 不 过 上 HS (Se) 不 是 一 个 逻辑 连接 词 。 

为 了 方便 书写 规则 , 工 和 A 用 来 代表 公式 的 多 重 集合 。 逗 号 表示 多 重 集合 的 并 ， 因 此 TT, A 
代表 IT 和 A 的 并 集 。 在 需要 多 重 集合 的 地 方 出 现 的 公式 (RC 上 4 中 的 %) 表示 了 一 个 元 素 的 多 
重 集合 。 因 此 ，T, 8 是 包含 至 少 一 个 8 的 多 重 集合 ， 其 中 I 表示 多 重 集合 中 的 其 他 元 素 。 

有 效 性 和 基本 相继 式 。 有 效 相继 式 是 指 在 所 有 结构 和 赋值 下 都 为 真 的 相继 式 。 相 继 式 演 
算 中 的 定理 就 是 那些 有 效 相 继 式 。 

当 两 边 都 含有 一 个 公共 的 公式 好 | ， 相 继 式 是 基本 的 (basic)。 这 可 以 形式 化 地 写 为 公理 

$. A, G 





RD RE EHH 305 


根据 刚才 讲述 的 记 法 ，4 THA 4 都 是 含有 4 的 多 重 集合 。 这 样 的 相继 式 显然 是 有 效 的 。 

那些 包含 于 T 和 A 中 的 其 他 公式 在 推理 中 不 起 作用 。 有 时 要 对 相继 式 演算 进行 整理 以 使 基 
本 相继 式 具 有 形式 8 + %。 然 后 ， 形 如 办 工 上 A, 9 的 相继 式 就 可 以 借助 “弱化 ”规则 推导 出 
来 了 ， 该 规则 可 以 将 任意 公式 插入 相继 式 中 。 

连接 词 的 相继 式 规则 。 相 继 式 演算 的 规则 是 成 对 出 现 的 ， 分 别 将 每 个 连接 词 插入 到 上 符 
号 的 左 侧 或 右 侧 。 例 如 ， 规 则 人 入 :left 将 合 取 插入 左 侧 ， 而 人 :right 则 将 合 取 插入 右 侧 。 下 面 是 
后 者 的 常用 记 法 ， 前 提 在 上 ， 结 论 在 下 : 


rA, TEHA, Y 
TEA,dAW 


为 了 证 明和 A:right 是 一 条 合理 的 规则 ， 我 们 假设 它 的 前 提 是 有 效 的 并 说 明 结 论 也 是 有 效 的 。 假 
设 在 某 些 结构 和 赋值 下 ，I 中 的 所 有 公式 都 为 真 ， 我 们 必须 说 明 A, $A 入 中 的 某 个 公式 也 为 真 。 
如 果 A 中 没有 公式 为 真 ， 那 么 根据 前 提 4 和 yw 两 者 都 为 真 。 因 此 YA YAH. 

现在 来 说 明 规 则 入 :left 的 正确 性 。 


入 :right 


bp,v,THA 
Qay TEFA 
为 了 说 明 这 条 规则 合理 ， 我 们 像 上 面 那样 进行 证 明 。 假 设 T, BA yy 中 的 所 有 公式 为 真 ， 那 么 
和 ?两 者 都 为 真 。 在 前 提 有 效 的 假设 下 ，A 中 的 某 个 公式 必须 为 真 ， 也 就 得 到 了 结论 。 
图 10-1 给 出 了 命题 连接 词 A、V 、 一 、<= 和 的 规则 。 所 有 规则 的 论证 都 是 类 似 的 。 


‘left :right 


人 入 :left 


$,y,THFA TrA, TEHA, Y 
由 和 人 落下 上 FA THA, AY 
PTFA VTA TEHA, $, Y 
yvy, THA TrA, pyy 


THA, 9 VRHFA TEHA, Y 
$> yT TEFA rA, ġ >y 


$, V, THA TEHA, ġ, Y gFFAY VIFA,Y 
poy FA TFA, $ oy 


rrA,¢ %,TrFA 





图 10-1 命题 连接 词 的 相继 式 规则 


练习 10.2 证 明 规则 V :left 和 YV :right 是 正确 的 。 
练习 10.3 证 明 规则 e :left 和 <> :right 是 正确 的 。 


10.2 证 明 相 继 式 演算 中 的 定理 
推理 规则 通常 是 顺 正 向 (由 上 至 下 ) 阅读 的 ， 从 前 提 到 结论 。 因 此 人 :right 接 受 前 提 T 上 
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A, PHT F AL wy, 产生 结论 T 上 FF A,gAuy。 对 结论 的 相继 式 应 用 另 一 个 规则 将 产生 另 一 个 结论 ， 
依 此 类 推 。 一 个 形式 证 明 是 通过 应 用 推理 规则 构造 的 一 棵 树 。 下 面 是 相继 式 8gAV 上 yA 4 的 
证 明 : 
vty oko 
BKS An A 
GAWrWAG 
从 正 向 看 ， 首 先 两 个 基本 相继 式 通 过 人 入:right 组 合 ， 然 后 其 结论 再 经 和 :left 变 换 。 但 是 ， 正 向 
阅读 并 不 能 帮助 我 们 找到 一 个 给 定 相继 式 的 证 明 。 

为 了 达到 发 现 证 明 的 目的 ， 应 从 反 向 (由 下 至 上 上 ) 去 看 规则 ， 从 目标 到 子 目标 。 因 此 ， 
A:right 接 受 目标 F FF A, Au 并 返回 子 目标 TH A, OAT 上 A, y 如 果 可 以 证 明 这 些 子 目 标 
是 定理 ， 那 么 该 目标 也 是 。 子 目标 将 通过 进一步 应 用 规则 来 求 精 ， 直 到 剩 下 的 所 有 子 目 标 都 
是 基本 相继 式 为 止 ， 这 时 立即 可 知 它们 是 有 效 的 。 证 明 树 是 由 根 向 上 构造 的 ， 这 一 过 程 被 称 
为 求 精 (refinement) 或 反 向 证 明 (backward proof). 

从 反 向 看 ， 证 明 (*) 从 要 证 明 的 相继 式 开 始 ， 也 就 是 gAU FF 东 Ahg。 这 一 目标 通过 入 :left 
被 求 精 到 9, WL WA 和 A$， 这 一 子 目 标 通过 入 :right 被 求 精 到 9, y 上 yio, y 上 4g。 最 后 这 两 个 
子 目 标 都 是 基本 相继 式 ， 证 明 也 就 结束 了 。 

在 反 向 阅读 下 ， 每 条 规则 拆 解 目标 中 的 一 个 公式 。 应 用 入 :left 将 左 侧 的 合 取 拆 开 ， 应 用 
A:right 将 右 侧 的 合 取 拆 开 。 如 果 所 有 结果 子 目 标 都 是 基本 相继 式 ， 那 么 初始 目标 就 得 证 了 。 
对 于 命题 逻辑 ， 这 一 过 程 一 定 会 终止 。 

一 个 相继 式 可 以 有 多 个 不 同 的 证 明 ， 这 取决 于 首先 拆 开 哪 个 公式 。 证 明 (*) 首 先 拆 开 了 9 
Ay E yw 和 A9 左 侧 的 合 取 式 。 为 了 得 到 一 个 不 同 的 证 明 ， 可 以 首先 拆 开 右 侧 的 合 取 式 : 


入 :right 
人 :left ` “) 


dowry. eyre .. 

gayr y “ett payo ^ileft 

一 -一 一 一 一 一 一 一 人:right 
CENA Aa EN 


这 比 证 明 ( 和 要 长 ， 因 为 A:left 被 应 用 了 两 次 。 对 初始 目标 应 用 和 :right 产生 了 两 个 子 目标 ， 
每 个 的 左 侧 都 有 一 个 合 取 式 。 如 果 每 一 步 都 选择 产生 最 少子 目标 的 规则 ， 则 通常 会 得 到 较 短 
的 证 明 。 

总 结 我 们 的 证 明 步 又 如 下 : 

。 取 得 要 证 明 的 相继 式 作为 初始 目标 。 证 明 树 的 根 ， 也 是 唯一 的 叶子 ， 就 是 这 个 目标 。 

。 选 取 某 个 证 明 树 的 叶子 作为 子 目 标 ， 并 对 其 应 用 一 条 规则 ， 将 这 一 叶子 转变 为 一 个 具有 

一 个 或 多 个 叶子 的 分 支 结 点 。 

。 在 所 有 叶子 都 是 基本 相继 式 时 停止 (证 明成 功 )， 或 在 找 不 到 可 以 应 用 到 一 个 叶子 (F 

目标 ) 上 的 规则 时 停止 (证 明 人 失败 )。 

这 套 步骤 非常 有 效 ， 尽 管 它 的 搜索 是 不 确定 的 。V :left 和 人 入:right 都 可 以 应 用 于 子 目 标 p Vg,7 
F_rAr。 前 一 规则 对 无 美的 pv 4 进行 情形 分 析 ; 后 一 规则 产生 两 个 基本 的 子 目标 证明 立 即 
成 功 。 
练习 10.4 构造 相继 式 gVy 上 WV oR AA p) 上 A A p) A pIE, 
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练习 10.5 构造 下 面相 继 式 的 证 明 

KD Ad)VY GVW ACY y) 
练习 10.6 证 明 任何 上 符号 左 侧 同时 含有 4 -~ 4 的 相继 式 是 有 效 的 。 
10.3 量词 的 相继 式 规则 


命题 逻辑 是 可 判定 的 ， 我 们 的 证 明 步 又 在 有 限 的 时 间 内 就 可 以 确定 任意 一 个 公式 是 否 为 定 
理 。 当 加 入 量词 时 ， 就 不 存在 这 样 的 判定 步骤 了 。 此 外 ， 量 词 带 来 了 许多 语法 上 的 复杂 问题 。 

每 个 量词 约束 一 个 变量 ， 因 此 在 Vx.3y.R(x, y, z) 中 x 和 y 是 被 约束 的 ， 而 z 是 自由 的 。 重 新 命 
名 约束 变量 不 会 影响 公式 的 含义 ， 前 例 和 Vy.3w.RGy, w, z) 是 等 价 的 。 有些 推理 规则 涉及 了 赫 
换 ，p[z/x] 则 代表 了 在 9 中 将 所 有 自由 的 x 都 替换 成 所 产生 的 结果 。 不 那么 正式 的 话 ，q() 代 表 
了 含有 x 的 公式 ， 而 WD 代表 了 将 自由 的 x 替换 成 以 后 的 结果 。 和 演算 语法 中 约束 变量 的 无 名 表 
示 法 (9.6 节 ) 同样 适用 于 量词 语法 。 


全 称 量词 有 下 面 两 条 相继 式 规则 : 
glt/x], ¥x.¢, TFA ， reEA,¢ o 
wp rra f FFA, vg "isht 


限制 条 件 : x 不 能 在 结论 中 自由 出 现 


规则 VY:left 容 易 理 解 ， 如 果 Vx.9 为 真 ， 那 么 9[t/x] 也 为 真 ， 其 中 i 是 任意 项 。 
为 了 证 明 更 为 复杂 的 规则 V:right 是 正确 的 ， 我 们 假设 它 的 前 提 有 效 ， 然 后 证 明 其 结论 也 
有 效 。 给 定 某 个 结构 和 赋值 ， 假 设 所 有 LI 中 的 公式 都 为 真 ， 并 且 A 中 没有 公式 为 真 ， 那 么 我 们 
必须 证 明 Vx.9 为 真 。 这 只 要 证 明 对 于 每 一 个 可 能 的 x 赋值 来 说 ， 在 其 他 变量 保持 不 变 的 情况 下 
9 为 真 。 根 据 V:right 的 限制 条 件 ， 改 变 x* 的 值 不 会 影响 TT 和 A 中 任何 公式 的 真 值 ， 又 由 于 前 提 有 
效 ， 则 9 一 定 为 真 。 
忽略 这 个 限制 条件 可 能 会 产生 莞 座 的 推理 : 
P(x) 上 P(x) 
P(x) FF Wx. P(x) 


当 P(x) 代 表 整 数 上 的 谓词 x = 0， 并 且 x 被 赋值 为 0 时 ， 这 个 结论 为 假 。 


V:right 


存在 量词 有 下 面 两 条 相继 式 规则 : 
$, THA - CEA, Ax.g, pli/x] ,. 
aed. FRA TEA 3:left TEA xg A, xd 3:right 


限制 条 件 : x 不 能 在 结论 中 自由 出 现 


它们 是 全 称 量词 规则 的 对 偶 ， 可 以 类 似 地 进行 论证 。 注 意 ，3x.g 等 价 于 -Vx. > 6. 

规则 V:left 和 3:right 有 一 个 其 他 规则 所 没有 的 特点 : 在 反 向 证 明 中 ， 它 们 不 从 目标 中 删除 
任何 公式 。 它 们 展开 一 个 量词 公式 ， 把 一 项 替换 进 公 式 体内 ， 同 时 保留 这 个 公式 并 允许 重复 
展开 。 事 先 确定 证 明 中 需要 对 一 个 量词 公式 进行 多 少 次 展开 是 不 可 能 的 。 正 因为 如 此 ， 我 们 
的 证 明 步 又 可 能 停 不 下 来 ， 一 阶 逻 辑 是 不 可 判定 的 。 
练习 10.7 ”如果 忽 略 V:right 的 限制 条 件 ， 用 到 这 一 规则 的 证 明 会 得 到 不 一 致 的 结论 吗 ? (这 
意味 着 有 一 个 相继 式 + OEE ~ 是 个 有 效 公 式 。) 
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10.4 带 量 词 的 定理 证 明 


我 们 的 反 向 证 明 步 又 对 于 量词 相当 有 效 ， 至 少 在 对 付 简单 问题 上 不 需要 更 具 识 别 能 力 的 
搜索 。 我 们 从 一 个 涉及 全 称 量词 的 简单 证 明 开 始 : 


p(x), Vx. bX) F oa), YO 


V:left 
Wo FOC). WO) Vigh 
Yx. pœ F PO) V w(x) V:right 


Vx. (x) H Vx. p) V w(x) 


V:right 的 限制 条 件 成 立 ，x 在 结论 中 不 是 自由 的 。 在 反 向 证 明 中 ， 这 一 结论 是 初始 目标 。 
如 果 我 们 首先 应 用 V:left 来 插入 公式 x)， 那 么 x 在 子 目 标 中 就 是 自由 的 了 。 之 后 则 必须 重 
新 命名 量词 变量 才能 应 用 V:right: 


pw, Vx. bx) F 60), YO) V:right 
(x), Vx.o@) F 0) V ¥O) V:right 
(x), Wx. pO F Yx pw V WO) vy.left 
Vx. @() FVx.d@) VQ) — 
最 上 面 的 相继 式 并 不 是 基本 的 ， 要 完成 证 明 必须 再 次 应 用 V:left， 第 一 次 应 用 这 条 规则 没 起 到 
什么 作用 。 我 们 有 了 一 个 一 般 性 的 启发 式 原则 : 如 果 有 另 一 规则 可 以 有 效 地 应 用 到 目标 上 ， 
则 不 要 去 使 用 V:left 和 3:right 。 
下 面 的 证 明说 明了 使 用 量词 的 一 些 困 难 。。” 
(x), $2) F az.) > Vx.b(), p), Yx.) 


TOER OESE ON GO), OESE OR EA 

TER OESE OAO -right 

TOER OESE BO), Vx. GO right 
H 3z.b(z) 一 Yx.ġ (x), pz) > Yx. ġ (x) 3:right 


F Az. f(z) > Wx. d(x) 
从 目标 向 上 进行 ， 应 用 3:right 加 进 了 z 作 为 自由 变量 。 虽 然 存在 量词 公式 仍 在 子 目 标 中 ， 但 是 
它 将 保持 静止 直到 再 次 到 达 一 个 没有 其 他 规则 可 以 应 用 的 目标 。 下 一 步 推 理 一 :right 将 8(z) 移 
到 左 侧 。 由 于 x 在 子 目 标 中 不 是 自由 的 ， 因 此 可 以 应 用 VY:right， 将 Vx.9(x) 换 成 了 9(x)。 在 结果 
子 目 标 中 再 次 应 用 了 3:right (没有 其 他 选择 ) ， 用 x 替 换 z。 在 ~ :right 之 后 ， 最 终 的 子 目标 是 一 
个 基本 相继 式 ， 它 在 两 边 都 有 (x)。 

注意 3z.9(z) 一 Vx.9(Xx) 通 过 3:right 被 展开 了 两 次 。 这 个 相继 式 没有 其 他 证 明 方 法 。 对 于 任意 
给 定 的 x， 都 不 难 设计 出 需要 展开 n 次 的 相继 式 。 

合 一 。 在 量词 的 论证 中 ， 有 一 个 难点 : 在 规则 3:right 和 V:left 中 如 何 选择 项 !。 这 相当 于 预 
测 哪 一 项 会 最 终 产生 基本 子 目标 和 一 个 成 功 的 证 明 。 在 上 面 的 证 明 中 ， 第 一 次 3right 时 对 z 的 
选择 是 任意 的 ， 任 何 项 都 能 行 。 第 二 次 3:right 时 选择 x 是 关键 的 一 一 但 可 能 并 不 明显 。 

我 们 可 以 在 这 样 的 规则 中 推迟 项 的 选择 。 我 们 引入 元 变量 (meta-variable) ?a, 2b, ... 作为 
占 位 项 。 当 一 个 目标 可 以 通过 将 它 的 元 变量 替换 成 适当 的 项 来 解决 时 ， 就 在 整个 证 明 中 进行 
这 一 替换 。 例 如 ， 对 于 子 目 标 PCza,T H A, P(f(?b)) 来 说 ， 当 我 们 将 ?4 换 成 1(?b) 时 ， 它 就 成 


O 为 了 看 出 3z.9(z) ~ Vx. 和 (x) 是 一 条 定理 ， 首 先 注意 它 的 金 括号 形式 为 : 3z.[Wz) — (Wx. ox). HER 
推进 昔 涵 式 内 部 则 将 其 变 为 全 称 量词 。 于 是 这 个 公式 就 等 价 于 (Vz.Wz)) + (Wr. (x) ， 这 显然 为 真 。 
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为 基本 的 了 ， 可 以 看 到 ，?a 尚 未 完全 确定 ， 只 是 确定 了 它 的 外 层 形式 f(…)。 未 知 项 以 递增 的 
方式 逐步 解决 。 合 一 (unification) 这 一 确定 适当 替换 的 过 程 ， 是 量词 论证 的 关键 。 
规则 V:left 现 在 有 具有 如 下 形式 ， 其 中 ?a 代表 任意 元 变量 : 
pl?a/x], ¥x.9, TRA 
Yx., TFA 
强制 限制 条 件 。 元 变量 自身 也 有 麻烦 。 回 忆 一 下 ，V:right 和 3:left 具 有 限制 条 件 “x 不 能 在 
结论 中 自由 出 现 *。 如 果 结 论 中 含有 元 变量 又 怎么 办 呢 ? 这 些 元 变量 可 能 被 任何 项 替换 掉 。 我 
们 的 方案 是 将 每 个 自由 变量 标记 上 一 个 禁止 元 变量 表 。 自 由 变量 bw 不 能 被 包含 在 用 于 赫 
换 元 变量 ?a1, .… , ?ai 的 项 内 。 合 一 算法 可 以 强制 这 一 点 。 
让 我 们 简化 一 下 术语 。 带 标签 的 自由 变量 称 为 参数 。 元 变量 则 称 为 变量 。 
使 用 参数 ， 规 则 V:right 变 为 


V:left 


TEA, gb 


Pay. 


,1x| 限制 条 件 : 5 不 能 出 现在 结论 中 ， 
TRA Wo i"ight  。 且 ?o…,?a 是 结论 中 所 有 的 变量 。 
限制 条 件 的 第 一 部 分 保证 了 2 尚未 被 使 用 ， 而 第 二 部 分 保证 了 2 在 稍 后 的 替换 中 不 会 渔 进来 。 
对 3:left 的 处 理 也 是 一 样 的 。 

参数 保证 了 正确 的 量词 论证 。 例 如 ，Vx.Wx, ) 一 般 来 说 并 不 蕴涵 3y.Vx.p(x, y) FATE 
对 相应 相继 式 的 尝试 证 明 : 


(2c, 2c), Vx.h(x, x) F By.Vx.p (x, y), $ (ba, 2a) 


‘left 
Wx. (x, x) F ay.¥x.6(x, Y), Gra, 22) right 
Yx. (x, x) 上 dy.Vx.0(x, y), Yx.ġ (x, 2a) 3:right 


Vx.p(x, x) 上 3 了.Yx. 骨 (xc y) 
最 上 面 的 相继 式 不 可 能 变 成 基本 的 。 要 想 使 g(?c, ?c) 和 9(b2s, ?a) 相 等 ， 必 须 有 一 个 替换 将 ?c 
和 ?a 都 换 成 b;,。 然 而 ， 参 数 b2s 被 禁止 出 现在 赫 换 ?a 的 项 中 。 这 一 尝试 性 证 明 会 继续 通过 应 用 
V:right 和 3:left 向 上 增长 ， 但 永远 不 会 产生 基本 相继 式 。 
为 了 对 比 ， 我 们 来 证 明 例子 Vx.Wx, x) Ba AV xJy.or, y): 


(2c, Ic), Yx. (x, x) F 3y.ġ (a, y), Pa, 2b) V:left 
Yx. (x, x) F 3y.ġ (a, y), $ (a, ?b) 3:right 
Wx.6(x, x) F 3y.ġ (a, y) 
Vx.0(x, x) F Wx.dy.6(x, y) 


将 ?25 和 ?c 都 赫 换 成 <， 可 以 把 入 ?c, ?c) 和 qa, ?5) 都 变换 成 Ha, a)， 证 明 就 结束 了 。 参 数 a 没 有 标 
记 任何 变量 ， 因 为 在 供给 V:right 的 目标 中 没有 变量 。 


V:right 


O| 进一步 的 头 读 。 不 少 教科 书 者 是 从 计算 机 科学 的 角度 讲述 逻辑 的 。 它 们 把 重点 
放 在 证 明 步 骤 与 合 一 上 ， 回 避 了 数理 还 辑 所 关心 的 更 为 传统 的 问题 ， 例 如 模型 论 。 
HF PB, KRUGalton (1990) 或 Reeves 和 Clarke (1990), Gallier 
(1986) 给 出 的 是 一 个 以 相继 式 演算 为 中 心 的 更 具 技术 性 的 讲解 。 
练习 10.8 重新 构造 上 面 的 前 三 个 量词 证 明 ， 这 回 使 用 (元 ) 变量 和 参数 。 
练习 10.9 通过 让 P 来 表示 某 个 结构 里 的 一 个 恰当 关系 来 举 出 相继 式 Vx.P(x, x) 上 3y.Vx.P(x, y) 
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的 反例 。 


练习 10.10 如果 对 Vx.Wx, x) H Iy Vrp, 》) 的 尝试 证 明 继 续 进 行 下 去 的 话 ， 参 数 能 不 能 使 


它 成 功 ? 


练习 10.11 说明 仅 应 用 -次 3:right 无 法 证 明 F 3z.9(2) > Vx.9(x)。 
练习 10.12 ”对 于 下 面 每 条 构造 “个 证 明 ， 或 说 明 不 存在 证 明 (a 和 4 是 常量 ): 


FF 3z.) > pla) A gb) 


Yx. 3y. (x, y) k dy. Vx. Ox, y) 
Jy. Yx. (x, y) & Vx. dy. (x, y) 


在 ML 中 处 理 项 和 公式 


我 们 来 为 定理 证 明 编 写 一 个 框架 。 


它 必 须 能 表示 项 和 公式 ， 同 时 实现 抽象 、 替 换 、 语 法 


分 析 和 美化 打印 。 要 感谢 前 面 章节 积累 起 来 的 方法 ， 它 们 使 得 这 项 程序 设计 任务 中 没有 什么 


特别 困难 的 。 
10.5 表示 项 和 公式 


我 们 为 入 -演算 开发 的 技术 (9.7 节 ) 也 可 用 于 一 阶 逻 辑 。 在 某 些 方面 ， 一 阶 逻 辑 更 为 简单 。 
[407] 推理 只 能 影响 最 外 层 的 变量 约束 ， 没 有 与 -项 中 的 归 约 相对 应 的 东西 。 
签名 。 签 名 FOL 定 义 了 一 阶 逻 辑 中 项 和 公式 的 表示 : 


signature FOL = 
sig 
datatype term 


datatype form 


| 
| 
| 


type goal 

val precOf 
val abstract 
val subst 

val termVars 
val goalVars 
val termParams 


val goalParams 


end; 


Var of 
Param of 
Bound of 
Fun of 
Pred of 
Conn of 
Quant of 


string 
string 
int 

String 
string 
string 
String 


* string list 
* term list 
* term list 
* form list 
* string * form 


form list * form list 


: String -> int 
: int -> term -> form -> form 

: int -> term -> form -> form 

: term * string list -> string list 
: goal *string list -> string list 

: term * (string * string list) list 


-> (string * string list) list 


: goal * (string * string list) list 


-> (string * string list) list 


类 型 1erm 实 现 了 上 一 节 所 讲 的 方法 。 变 量 (构造 子 Var) 有 一 个 名 字 。 约 束 〈Bound) 变量 有 
PRS. BH (Fun) 应 用 有 函数 名 和 参数 表 ， 没 有 参数 的 函数 只 是 一 个 常量 。 参 数 
(Param) 有 一 个 名 字 和 一 个 禁止 变量 表 。 

类 型 form 是 基本 的 。 原 子 公 式 (Pred) 有 一 个 谓词 的 名 字 和 参数 表 。 连 接 词 应 用 (Conn) 
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有 一 个 连接 词 和 一 个 公式 表 ， 通 常 都 是 "~"、"&"、"|"、"-->" 或 "<->" 和 一 个 或 两 个 公式 
(的 表 ) 组 成 的 序 偶 。Quant 公 式 有 一 个 量词 ("ALL" 或 "EX" 之 一 )， 一 个 约束 变量 名 字 和 一 
个 公式 作为 公式 体 。 

类 型 goal 是 对 公式 表 序 偶 类 型 的 缩写 。 有 些 早期 的 ML 编译 器 不 允许 在 签名 中 使 用 类 型 缩 
写 。 我 们 可 以 简单 地 将 goai 描 述 为 一 个 类 型 : 它 在 结构 中 的 声名 就 会 对 外 可 见 。 

函数 precOf/ 定 义 了 连接 词 的 优先 级 ， 这 是 语法 分 析 和 美化 打印 所 必需 的 。 

函数 abstract 和 subst 类 似 于 上 一 人 章 的 同名 转 数 。 调 用 abstract i t p 把 p 中 每 一 个 1 都 赫 换 成 索 
aji ( 它 在 各 量词 限定 域 中 递增 ) ， 典 型 情况 是 ; = 0，1 为 一 个 原子 项 。 调 用 subst it p 把 公式 p 中 
的 索引 i (在 量词 限定 域 中 递增 ) 替换 成 !。 

函数 termVars 收 集 了 项 中 的 变量 表 ( 没 有 重复 )，rtermVars(1, bs) 将 :中 的 所 有 变量 插入 到 了 
表 bs 中 。 参 数 bs 可 能 看 上 去 有 些 复杂 且 没 有 必要 ， 但 是 它 省 去 了 代价 很 高 的 表 追 加 操作 ， 同 
时 允许 rermVars 被 推广 到 公式 和 目标 上 去 。 这 一 点 在 看 到 函数 的 具体 定义 时 会 变 得 更 清楚 。 

国 数 goalyars 也 有 两 个 参数 ， 它 收集 目标 的 变量 表 。 在 Hal 中 ， 目 标 是 一 个 相继 式 。 虽 然 
在 ML 中 相继 式 是 用 公式 表 表 示 的 ， 而 不 是 用 多 重 集合 ， 但 是 我 们 应 该 可 以 实现 上 面 讨 论 过 的 
证 明 方式 。 

函数 termParams 和 goalParams 相 应 地 收集 了 项 或 目标 的 参数 表 。 每 个 参数 都 由 它 的 名 字 
和 与 之 相关 联 的 变量 名 表 构 成 。 

结构 。 结 构 Fol (图 10-2) 实现 了 签名 FOL。 为 了 节省 版 面 空间 ， 其 中 term 和 form 的 数据 
类 型 (datatype) 声明 被 略 去 了 ， 它 们 和 签名 中 的 完全 一 样 。 该 结构 定义 了 几 个 签名 中 没 
有 描述 的 函数 。 













Structure Fol : FOL = 
struct 
datatype term = ...; datatype form =... 


type goal = form list * form list; 











fun replace (ul,u2) t = 
if t=ul then u2 else 
case t of Fun(a,ts) => Fun(a, map (replace(ul,u2)) ts) 
| - => t; 


fun abstract i t (Pred(a,ts)) 
abstract i t (Conn(b,ps)) 
abstract i t (Quant(qnt,b,p)} 


Pred(a, map (replace(t, Bound i)) ts) 
Conn(b, map (abstract i t) ps) 
Quant(qnt, b, abstract (i+1) t p); 


tou H 


fun subst i t (Pred(a,ts))} Pred(a, map (replace (Bound i, t)) ts) 
subst i t (Conn(b,ps) ) Conn(b, map (subst i t) ps) 
subst i t (Quant(qnt,b,p)) = Quant(qnt, b, subst (i+1) t p); 





fun precOf "~" 
precOf "&" 
precof "|" 
precOf "<->" 
precOf "-->" 
precOf _ 


4 


rP PNW 


wou wow da 


1 (* 意味 着 不 是 一 个 中 缀 *); 








图 10-2 一 阶 逻 辑 : 表示 项 和 公式 
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accumForm f (Pred(_,ts), 2) = foldr f z ts 
accumForm f (Conn(_,ps), z) = foldr (accumForm f) z ps 
accumForm f (Quant(_,_,p), z) = accumForm f (p,2); 


accumGoal f ((ps,qs), z) = foldr f (foldr f 2 qs) ps; 
insert ... 


termVars (Var a, bs) insert (a, bs) 


termVars (Fun(_,ts), bs) = foldr termVars bs ts 


termVars (_, bs) bs; 
goalVars = accumGoal (accumForm termVars) ; 


termParams (Param(a,bs), pairs) = (a,bs) :: pairs 
termParams (Fun(_,ts), pairs) = foldr termParams pairs ts 
termParams (_, pairs) = pairs; 


goalParams = accumGoal (accumForm termParams) ; 





图 10-2 (4%) 


调用 replace(u1, u2) ! 将 把 项 t 中 所 有 的 项 xl 替换 成 上 2。 这 个 图 数 由 abstract 和 supst 周 用 。 

算 子 accumForm 和 accumGoal 演 示 了 高 阶 程 序 设 计 。 假 如 对 于 某 个 类 型 [， /具有 类 型 term 
xT~T， 其 中 ft, x) 在 x 中 积累 了 关于 的 某 些 信息 。( 例 如 ，f 可 以 是 termVars， 它 积累 了 项 的 
自由 变量 列表 。) foldrf 则 将 f 推 广 到 项 的 列表 上 。 函 数 accumForm f 具 有 类 型 form x tt, $ 

f 推广 为 公式 操作 。 这 个 函数 用 foldr /去 处 理 谓词 Po， …, 1,) 的 参数 ， 它 还 递归 地 调用 foldr 
.(accumForm 用 去 处 理 连 接 词 的 公式 表 。 算 子 accumGoal 两 次 调用 foldr， 将 一 个 具有 类 型 form 
xt 7 的 函数 推广 到 一 个 具有 类 型 Gorm list x form list) x t> 1 的 函数 。 它 可 以 将 一 个 有 关公 
式 的 函数 推广 到 有 关 目 标的 函数 。 

算 子 accumForm 和 accumGoal 为 遍历 公式 和 目标 提供 了 一 种 统一 的 方式 。 它 们 定义 了 函数 
goalVars 和 goalParams， 并 且 还 可 以 有 很 多 类 似 的 应 用 。 此 外 ， 它 们 是 高 效 的 它们 不 创建 任 
何 表 和 其 他 数据 结构 。 . 

函数 termVars 和 termParams 是 通过 递归 定义 的 ， 它 递归 地 扫描 一 项 来 积累 其 中 的 变量 或 参 
数 。 这 两 个 函数 都 用 /oldr 来 遍历 参数 表 。 国 数 inserr (为 了 节省 版 面 略 去 了 ) 建立 一 个 无 重复 
字符 串 的 有 序 表 。 注 意 ，termyars 不 认为 参数 启 .xu 包含 变量 ?at，…, ?ak， 这 些 禁 止 变量 在 逻 
辑 上 不 是 该 项 的 一 部 分 ， 也 许 应 该 放 在 一 个 单独 的 表格 中 。 
练习 10.13 ”概述 如 何 修改 FOL 和 Fol 以 采用 一 种 新 的 表示 项 的 方法 。 约 束 变量 使 用 名 字 标 识 ， 
但 从 语法 上 与 参数 和 元 变量 是 有 区 别 的 。 这 样 的 表示 法 能 用 于 入 -演算 吗 ? 
练习 10.14 改变 类 型 form 的 声明 , 将 Conn 换 成 为 每 个 连接 词 单独 设置 的 构造 子 ,比方 说 Neg、 
Conj、Disj、Imp、1f。 相 应 地 修改 FOL 和 Fol。 


练习 10.15 函数 accumGoal 实 际 上 比 上 面 提 到 的 更 为 多 态 。 它 最 为 一 般 性 的 类 型 是 什么 ? 
10.6 分 析 和 显示 公式 
我 们 的 语法 分 析 器 和 美化 打印 程序 (分别 出 自 第 9 章 和 第 8 章 ) 可 以 实现 一 阶 逻辑 的 语法 。 
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我 们 使 用 下 面 的 文法 来 定义 项 (Term)、 可 选 参数 表 (TermPack) 和 非 空 项 表 (TermList): 


TermList = Term{, Term} « 


TermPack = ( TermList ) 
| Empty 

Term = Id TermPack 
| ? Id 


AK (Form) 是 通过 和 基本 式 (Primary) 相互 递归 来 定义 的 ， 基 本 式 由 原子 公式 和 它们 的 否 
定 构 成 : 
Form = ALL Id . Form 
| EX Id . Form 


| Form Conn Form 


| Primary 

Primary = ~ Primary 
| ( Form ) 409 
| Id TermPack 411 


量词 写成 ASCII 字 符 形式 时 变 成 ALL 和 EX， 下 面 的 表格 给 出 了 连接 词 的 写法 : 
常用 写法 : ” A vv 一 e 
ASCII 写 法 : ~ & 1 --> <-> 
由 于 ASCII 没 有 希腊 字母 ， 公 式 3z.9(z) 一 Vx.9(x) 可 能 要 被 写成 
EX z. P(z) --> (ALL x. P(x)) 


当量 化 公式 作为 一 个 连接 词 的 操作 数 时 ，Hal 要 求 它 被 括 在 括号 中 。 
语法 分 析 。 语 法 分 析 的 签名 是 很 短 的 。 它 只 是 描述 了 函数 read， 用 于 将 字符 串 转 换 为 
公式 : 
signature PARSE FOL = 
sig 
val read: string -> Fol.form 
end; 


在 我 们 实现 这 个 签名 之 前 ， 必 须 为 一 阶 逻 辑 的 词法 分 析 和 语法 分 析 创 建 结构 。 结 构 FolKey 定 
义 了 词法 规则 。 之 后 应 用 第 9 章 所 述 的 函 子 : 


structure FolKey = 
struct val alphas 


end; 
structure FolLex = Lexical (FolKey) ; 
structure FolParsing = Parsing (FolLex); 
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10-3 给 出 了 相应 的 结构 。 它 相当 简单 ， 不 过 有 几 点 值得 注意 。 


structure ParseFol : PARSE_FOL = 
struct 
local 


open FolParsing 
fun list ph = ph -- repeat ("," $-- ph) >> (op::); 


fun pack ph = "(" $-- list ph -- $")" >> #1 
| | empty; 


fun makeQuant ((qnt,b),p) = 
Fol. Quant (qnt, b, Fol.abstract 0 (Fol.Fun(b,{])) p); 


fun makeConn a p q = Fol.Conn(a, ([p.q)); 
fun makeNeg p = Fol.Conn("~", [p}]);. 


fun term toks = 
( id ~- pack Fol. Fun 
|| "2"$-- id Fol. Var ) toks; 


fun form toks = 
( $"“ALL" -- id -- *.* $-- form >> makeQuant 
|I $"Ex" -- id -- "." $-- form >> makeQuant 
| | infixes (primary, Fol.precOf, makeConn) 
and primary toks = 
( "~" $-- primary >> 
|| te S-- form =- $)" >> 
|| id -- pack term >> Fol.Pred ) toks; 
in 
val read = reader form 
end 
end; 





图 10-3 一 阶 逻辑 的 语法 分 析 

函数 jisr 和 pack 表 示 了 文法 短语 TermZisr 和 TermPack。 它 们 具有 一 般 性 ， 足 以 定义 任意 短 
语 的 “ 表 ” 和 “ 包 ”。 

该 语法 分 析 器 不 能 区 分 参数 中 的 常量 ,或 检测 函数 是 否 具有 正确 数目 的 实际 参数 : CRA 
保存 一 阶 逻 辑 函 数 和 谓词 的 任何 信息 。 该 语法 分 析 器 将 任何 标识 符 都 当 作 常 量 ， 用 Fun("x", O) 
来 表示 x。 当 分 析 量 化 结构 Yx.W ao 时， 它 对 量化 体内 oo 中 的 “常量 ”zx 的 所 有 出 现 进行 抽象 。 

和 上 一 章 中 讨论 的 一 样 ， 我 们 的 语法 分 析 器 不 能 接受 左 递归 文法 规则 ， 例 如 

Form = Form Conn Form 
Oe ER AER. DAI iB A Minfixes, CALL PETER: 

。primary 分 析 连 接 词 的 操作 数 。 

。precOf 定 义 连接 词 的 优先 级 。 

。makeConn 将 一 个 连接 词 应 用 到 两 个 公式 上 。 
结构 体 的 大 部 分 都 通过 local 声 明 设 成 私有 。 在 结尾 ， 它 定义 了 仅 有 的 可 见 标识 符 read。 如 
果 需 要 ， 为 项 声明 一 个 读 取 函数 也 很 容易 。 

显示 。 签 名 DISPLAY_FOL 描 述 了 公式 和 目标 (也 就 是 相继 式 ) 的 美化 打印 操作 符 : 
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signature DISPLAY_FOL = 
sig 
val form: Fol.form -> unit 
val goal: int -> Fol.goal -> unit 
end; 


国 数 g8oa! 的 整数 参数 将 显示 在 目标 之 前 ， 表 示 子 目标 序号 ，-- 个 证 明 状 态 通常 具有 几 个 子 目 
标 。10.14 节 中 的 会 话 描绘 了 这 个 输出 。 

结构 DisplayFol 实 现 了 这 一 签名 ， 见 图 10-4。 必 须 为 美化 打印 程序 提供 描写 格式 的 符号 表 
达 式 。 国 数 enclose 将 一 个 表达 式 包 在 括号 内 ， 而 必 t 在 表达 式 列 表 的 元 素 间 插入 去 号 。 两 者 结 
合 将 参数 表格 式 化 成 (11,…, 4,)。 


structure DisplayFol : DISPLAY_FOL = 
struct 


fun enclose sexp = Pretty.blo(1, {Pretty.str" (", sexp, Pretty.str")"]); 
fun commas [] [] 
commas (sexp: :sexps) Pretty.str"," :: Pretty.brk 1 :: 
sexp :: commas sexps; 


list (sexp: :sexps) Pretty. blo(0, sexp :: commas sexps); 


term (Fol.Param(a,_)) = Pretty.str a 
(Fol. Var a) Pretty .Sr ("?""a) 
(Fol. Bound i) = Pretty. str *??UNMATCHED INDEX??" 
(Fol. Fun (a,ts)) Pretty.blo(0, {Pretry.str a, args ts}) 
and [] Pretty . str” " 
| ts enclose (list (map term ts)); 


fun formp k (Fol.Pred (a,ts)) Pretty. blo(Q, [Pretty.str a, args ts]) 
| formp k (Fol.Conn("~", [p])) = — 
Pretty.blo(0, {Pretty.str "~", formp (Fol.precOf "~") pl) 
| formp k (Fol.Conn(C, [p,q])) 
let val pf = formp (Int.max(Fol.precOf C, k)) 
val sexp = Pretty.blo(0, [pf p, Pretty.str(" "°C), 
Pretty.brk 1, pf 9]) 
in if (Fol.precOf C <= k) then (enclose sexp) else sexp 
end 
| formp k (Fol.Quant(qnt,b,p)) = 
let val 9 = Fol.subst 0 (Fol.Fun(b,{])}) p 
val sexp = Pretty.blo(2, [Pretty.str(qnt ^ " " * b 7 "."), 
Pretty.brk 1, formp 0 q1) 
in if k>0 then (enclose sexp) else sexp 
end 


| formp k _ = Pretty.str"?2UNKNOWN FORMULA??"; 


fun formList [] = Pretty.str"empty" 
| formList ps = list (map (formp 0) ps); 


fun form p = Pretty.pr (TextlO.stdOut, formp 0 p, 50); 


fun goal (n:int) (ps,qs) = 
Pretty.pr (TextlO.. stdOut, 
Pretty.blo (4, [Pretty.str(" * ^ Int.toString n ^ ". *), 
: formList ps, Pretty.brk 2, Pretty.str"|- * 
formList qs}), 


r 


50}; 





图 10-4 一 阶 逻辑 的 美化 打印 
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416 
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参数 名 会 被 打印 出 来 ， 但 是 它 的 禁止 变量 表 不 会 被 打印 。 程 序 的 另 一 部 分 将 这 一 信息 显 
示 为 一 个 表格 。 

连接 词 的 优先 级 控制 着 括号 的 使 用 。 调 用 /ormp k 4 将 对 4 进行 格式 化 ， 如 果 需 要 ， 会 用 括 
号 将 其 括 住 ， 以 便 和 相 邻 的 优先 级 为 k 的 连接 词 隔离 开 来 。 在 生成 字符 串 qg& (p | oH, pir 
就 被 括 在 括号 中 ， 因 为 相 邻 的 连接 词 (8) 优先 级 为 3， 而 | 的 优先 级 为 2。 
练习 10.16 解释 ParseFol 中 ， 提 供给 >> 的 各 个 函数 的 作用 。 
练习 10.17 修改 语法 分 析 器 以 接受 q --> ALL x. p 作 为 a-(Vx.p) 的 正确 语法 。 使 得 它 不 
再 要 求 给 量化 公式 加 上 括号 。 
练习 10.18 在 q & (pl --> (p2 | z)) 中 ,内 层 的 那 一 对 括号 是 多 余 的 ， 因 为 | 的 优先 
级 比 ~--> 高 ， 我 们 的 美化 打印 经 常会 包含 这 样 无 用 的 括号 。 提 出 函数 form 的 修改 办 法 来 防止 
这 一 现象 。 
练习 10.19 解释 量化 公式 是 怎样 显示 的 。 
10.7 合 一 


Hal 试 图 将 目标 中 的 原子 公式 合 一 。 它 的 基本 合 一 算法 接受 不 含有 约束 变量 的 项 。 给 定 两 
个 项 ， 它 计算 出 一 个 (变量 , 项 ) 的 替换 集合 来 把 它们 变 为 相同 ， 或 者 报告 这 两 个 项 不 能 合 
一 。 进 行 替 换 的 过 程 称 为 实例 化 (instantiation )。 合 一 包括 三 种 情形 : 

函数 应 用 。 两 个 函数 应 用 能 被 合 一 仅 当 它们 应 用 的 是 同一 个 函数 ， 很 显然 没有 实例 化 可 
以 将 所?a) 和 g(b, ?c) 变 换 为 相同 的 项 。 要 将 g(t, 2) 和 g(wui, u2) 合 一 ， 就 要 一 致 地 合 一 tL 和 轴 以 及 
和 ws 一 一 也 就 是 说 ，g(?a, ?a) 不 可 能 与 8(b, c) 合 一 ， 因 为 一 个 变量 (2a) 不 可 能 替换 成 两 个 不 
同 的 常量 (b 和 ec )。 

ff 与 人，…, Ww) 的 合 一 从 与 的 合 一 开始 ， 然 后 将 得 到 的 赫 换 应 用 到 余下 的 项 上 。 
下 一 步 自 是 合 一 ts 与 42， 并 将 新 的 赫 换 应 用 到 余下 的 项 上 ， 依 此 类 推 。 如 果 其 中 任何 一 次 合 一 
失败 ， 那 么 该 函数 应 用 都 不 能 合 一 。 对 应 的 实际 参数 可 以 以 任意 顺序 进行 合 一 ， 对 结果 没有 
实质 影响 。 

参数 。 两 个 参数 仅 当 有 具有 相同 的 名 字 时 才能 合 一 。 参 数 不 能 与 函数 应 用 合 一 。 

变量 。 剩 下 的 也 是 最 有 意思 的 情形 就 是 将 变量 ?4 与 项 : (有 别 于 ?a) 合 一 。 如 果 ?a 没 有 出 
现在 :中 ， 则 合 一 成 功 ， 产 生 替 换 (?a, t)。 如 果 ?a 的 确 出 现在 :中 ， 则 合 一 失败 一 一 可 能 出 于 以 
下 两 个 不 同 的 原因 : : 

。 如果?a 出 现在 t 的 一 个 参数 中 ， 那 么 ?a 是 该 参数 的 一 个 “禁止 变量 ”"， 也 就 是 的 禁止 变量 。 

将 ?a 替 换 成 ! 会 违反 某 个 量词 规则 的 限制 条 件 。 

。 如 果 ;! 真 的 包含 ?ae， 那 么 这 两 项 就 不 可 能 合 一 : 不 存在 可 以 包含 它 自身 的 项 。 例 如 ， 不 

存在 替换 可 以 将 fR?q) 和 ?a 变换 成 相同 的 项 。 | 
这 就 是 臭名 昭著 的 出 现 检测 (occurs check ) ， 因 为 其 开销 ， 大 多 数 Prolog 解 释 器 都 省 略 它 。 对 
于 定理 证 明 来 说 ， 正 确 性 必须 优先 于 效率 ， 必 须 进 行 出 现 检测 。 

例子 。 要 将 g(?a, AK?c)) 与 8(K?5)，?q) 合 一 ， 首 先 要 将 ?ea 与 X?5) 合 一 ， 这 是 很 明显 的 一 步 。 
在 将 余下 实际 参数 中 的 ?a 替换 成 K?b) 之 后 ， 将 扩 ?c) 与 有 ?b) 合 一 。 这 将 ?c 赫 换 成 b>。 结果 可 以 写 
作 集 合 {?a hy fb), ?c 忆 ?b}。 合 一 后 的 公式 是 gt?b), Kb). 
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这 里 还 有 一 个 例子 。 要 将 g(?a, fla) Sed), ?b) 合 一 ， 第 一 步 还 是 将 ?a 替换 成 K?b)。 下 
一 步 要 做 的 就 是 将 KA?5)) 与 ?2b 合 一 一 一 这 是 不 可 能 的 ， 因 为 Kf?b)) 包 含 25。 合 一 失败 。 

参数 的 实例 化 。 我 们 知道 每 个 参数 都 带 有 一 个 禁止 变量 表 ，5;s 绝 对 不 能 作为 用 于 赫 换 ?a 
的 项 的 一 部 分 。 当 进行 一 个 合法 的 替换 时 ，b;。 中 的 ?a 会 被 替换 成 中 的 变量 ， 而 不 是 1 本 身 。 
例如 ,将 ?a 替 换 成 8(?c, AOD) NEP Dr ERA Dre, rao 任何 对 ?c 或 ?4 的 赫 换 事 实 上 也 是 对 ?a 的 替换 ， 
因此 ， 对 该 参数 来 说 ?zc 和 ?d 也 是 被 禁止 的 。 

例如 ， 要 将 8(?a, fbzo)) 与 8(h(?c, ?q), ?0) 合 一 ， 第 一 步 是 将 ?a 赫 换 成 h(?c, ?4)。g 的 第 二 个 
实际 参数 就 成 为 Kb>.x) 和 ?c， 这 两 项 是 不 可 合 一 的 ， 因 为 ?c 对 于 参数 bi. 是 被 禁止 的 。 


(O| skolem 却 数 。 参 数 在 定理 证 明 中 的 使 用 并 不 广泛 ， 更 为 传统 的 是 Skolem 济 数 。 
规则 VYV:left 和 3:right 可 以 引入 项 b(?a1,…,ay) 来 取代 参数 b 00, 4,0 KE, DR—A HR 
符号 ， 它 不 会 出 现在 证 明 的 其 他 地 方 。 这 种 项 和 参数 的 作用 一 样 ， 出 现 检测 防止 合 
一 违反 规则 的 限制 条 件 。Skolem 函 数 在 自动 证 明 过 程 中 有 长 处 ， 但 是 它 破 坏 了 公式 
的 可 读 性 ， 在 高 阶 逻辑 中 它 甚至 会 导致 错误 的 论证 。 


ML 代码 。 签 名 描述 了 合 一 和 实例 化 函数 ， 同 时 还 描述 了 用 于 报告 不 可 合 一 项 的 异常 Failled: 


signature UNIFY = 


sig 
exception Failed 
val atoms : Fol.form * Fol.form -> Fol.term StringDict.t 


val instTerm : Fol.term StringDict.t -> Fol.term -> Fol.term 
val instForm : Fol.term StringDict.t -> Fol.form -> Fol.form 
val instGoal : Fol.term StringDict.t -> Fol.goal -> Fol. goal 
end; 
函数 atoms 试 图 将 两 个 原子 公式 合 一 ， 而 instTerm、instForm 和 instGoal 则 相应 地 将 替换 应 用 到 
项 、 公 式 和 目标 上 。 
我 们 通过 一 个 字典 来 表示 替换 集合 ， 字 典 用 到 了 结构 StringPict (7.10 节 )， 变 量 名 恰好 是 
FFR. 
原子 公式 由 一 个 应 用 到 实际 参数 表 的 谓词 构成 ， 就 像 P(0,，…, 4)。 两 个 原子 公式 合 一 与 两 
个 函数 应 用 合 一 本 质 上 是 一 样 的 ， 谓 词 必 须 相 同 ， 且 相应 的 各 对 实际 参数 必须 同时 可 合 一 。 
结构 Unify (图 10-5) 实现 了 合 一 。 关 键 的 几 个 国 数 都 在 xz 访 Lists 中 进行 了 声明 ， 以 便 可 
以 访问 enay， 它 是 替换 的 环境 。 在 em 中 收集 替换 要 比 在 每 个 替换 生成 时 立即 应 用 更 有 效率 。 
替换 应 被 看 作 是 逐步 积累 起 来 的 ， 而 不 是 联 立 发 生 的 ， 这 一 点 如 同 在 和 -演算 解释 器 中 对 定义 
的 处 理 一 样 。 根 据 
{2b > g(z), ?a + f(2b)} 


ETT IKI RAS Hata Ob), (AE BAT RR oA Ne). EM RANA —- Be 
的 正确 处 理 。 
在 unifyLists 中 声明 了 几 个 函数 ， 下面 是 它们 的 一 些 注解 : 
。chase ! 当 ! 是 变量 时 ， 将 它 替 换 成 在 eny 中 对 它 的 赋值 。 非 变量 项 原样 返回 ， 每 一 阶段 ， 
合 一 都 只 关心 项 的 外 层 形式 。 
* occurs a t 测 试 变量 ?4 是否 在 项 中 出 现 ， 和 chase 一 样 ， 它 在 环境 中 查找 变量 。 
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eoccsl a ts 测试 变量 ?a 是 否 在 项 表 ts 中 出 现 。 

e unify(t, wu) 通过 合 一 1 与 4， 如 果 可 能 的 话 ， 来 创建 一 个 新 环境 ， 否 则 抛 出 异常 Failed。 如 
果 ! 和 zx 是 变量 ， 那 么 它们 在 eny 中 一 定 不 能 事先 有 赋值 ， 违 反 这 一 条 件 会 导致 一 个 变量 
拥有 两 个 赋值 ! 

“auntpidts,us) 同 时 合 一 表 5 和 ws 中 对 应 的 成 员 ， 如 果 两 个 表 长 度 不 等 则 抛 出 异常 Failed。 

(如 果 两 项 不 可 合 一 ， 则 异常 将 由 uni 抛 出 ， 而 不 是 由 unify! 抛 出 。) 


structure Unify : UNIFY = 
struct . 


exception Failed; 























fun unifyLists env = 
let fun chase (Fol.Var a) = (chase (StringDict.lookup (env ,a) ) 
handle StringDict.E _ => Fol.Var a) 
| chase t =f 
fun occurs a (Fol. Fun(_,ts)) = occsl a ts 
| occurs a (Fol.Param(_,bs)) = occsl a (map Fol. Var bs) 
| occurs a (Fol. Var b) = 
{a=b) orelse (occurs a (StringDict .lookup (env, b) ) 
handle StringDict.E _ => false) 
| occurs a _ = false 
and occsl a = List. exists (occurs a) 
and unify (Fol. Var a, t) = 
if t = Fol.Var a then env 
else if occurs a t then raise Failed 
else StringDict. update (env,a,t) 
| unify (t, Fol.Var a) = unify (Fol.Var a, t) 








| unify (Fol.Param(a,_), Fol.Param(b,_)) = if a=b then env 
else raise Failed 
| unify (Fol. Fun(a,ts), Fol. Fun(b,us)) = if a=b then unifyl (ts,us) 
else raise Failed 
| unify _ = raise Failed 
and unifyl ({], [)) = env 
| unifyl (t::ts, u::us) = unifyLists (unify (chase t, chase u)) (ts,us) 
| unifyl _ , = raise Failed 


in unifyl end 












atoms (Fol.Pred(a,ts), Fol.Pred(b,us)) = 
if a=b then unifyLists StringDict.empty (ts,us) else raise Failed 

| atoms _ = raise Failed; 
fun instTerm env (Fol. Fun(a,ts)) = Fol.Fun(a, map (instTerm env) ts) 

| instTerm env (Fol.Param(a,bs)) = 

Fol.Param(a, foldr Fol.termVars [] (map (instTerm env o Fol.Var) bs)) 

| instTerm env (Fol.Var a) = (instTerm env (StringDict . lookup (env,a) ) 

handle StringDict.E _ => Fol.Var a) 









| instTerm env t =t; 

fun instForm env (Fol.Predla,1s)) = Fol.Pred(a, map (instTerm env) ts) 
| instForm env (Fol.Conn(b, ps) ) = Fol.Conn(b, map (instForm env) ps) 
| instForm env (Fol.Quant(qnt,b,p)) = Fol.Quant(qnt, b, instForm env p); 





instGoal env (ps,qs) = (map (instForm env) ps, map (instForm env) qs); 


图 10-5 合 一 


这 个 实现 是 纯 函数 式 的 。 将 变量 表示 为 引用 可 能 更 为 高 效 





更 新 一 个 变量 即 可 完成 一 个 替 
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换 ， 不 需要 环境 一 一 但 这 和 策略 定理 证 明 不 相 容 。 将 -一 个 策略 应 用 于 一 个 证 明 状 态 应 得 到 新 
的 状态 ， 不 改变 原 有 的 状态 ， 以 便 可 以 尝试 其 他 策略 。 合 一 算法 可 以 使 用 命令 式 技术 ， 条 件 
是 它们 对 外 部 不 可 见 。 

当 两 项 不 可 合 一 时 合 一 国 数 抛 出 异常 Failed。 就 像 语法 分 析 中 的 那样 ， 失 败 可 能 在 深层 储 
套 的 递归 调用 中 被 发 现 ， 这 时 异常 将 向 外 传播 。 这 是 一 种 适合 异常 应 用 的 典型 情况 。 

函数 instTerm 如 前 所 述 地 在 参数 中 进行 厅 换 。 每 一 个 禁止 变量 都 被 换 成 替换 结果 项 中 的 一 
列 变 量 。 这 可 以 用 List.concat 来 完成 ， 但 是 使 用 foldr 和 termVars 的 组 合 将 减少 复制 的 次 数 。 


O| 高 效 的 合 一 算法 。 这 里 给 出 的 算法 在 非常 特别 的 情况 下 需要 指数 时 间 。 实 际 情 
况 中 ， 它 相当 好 用 。 也 存在 更 为 高 效 的 算法 。Paterson 和 Wegman (1978) 的 线性 时 
间 算 法 在 实践 中 被 认为 过 于 复杂 。Martelli 和 Montanari (1982) 的 算法 几乎 是 线性 的 ， 
是 为 实用 而 设计 的 。 然 而 ，Corbin 和 Bidoit (1983) 提出 了 一 个 基于 朴素 想法 的 算法 ， 
它 用 图 (实际 上 是 指针 ) 来 表示 项 ， 而 不 是 用 树 。 他 们 声称 这 个 算法 比 那 个 几乎 线 
性 的 算法 还 要 好 ， 因 为 其 简单 性 ， 尽 管 它 需 要 平方 时 间 。Ruzitka 和 Privara (1988) 
将 这 一 方案 求 精 ， 也 几乎 达到 线性 的 了 。 
练习 10.20 如 果 从 uni 忆 中 省 去 这 一 行将 发 生 什么 ? 


if t = Fol.Var a then env else 


策略 和 证 明 状 态 


我 们 关于 相继 式 演算 的 证 明 步骤 是 通过 逐步 求 精 来 操作 的 ， 从 一 个 目标 反 向 进行 。 证 明 
树 从 根 向 上 生长 。 在 ML 中 编码 这 一 过 程 需 要 一 个 证 明 状 态 (proof state) 的 数据 结构 ， 这 是 
部 分 构造 的 证 明 。 推 理 规则 实现 为 证 明 状 态 上 的 函数 ， 称 为 策略 (tactic). 


10.8 证 明 状 态 


形式 证 明 是 一 棵 树 ， 它 的 每 一 个 结 点 都 带 有 一 个 相继 式 和 一 个 规则 名 。 每 个 结 点 的 分 支 
指向 其 规则 的 前 提 。 但 是 ML 中 与 这 种 树 相 对 应 的 数据 类 型 并 不 适合 我 们 的 目的 。 反 向 证 明 需 
要 访问 叶子 ， 而 不 是 根 。 扩 展 证 明 将 把 一 个 叶子 转换 成 一 个 分 支 结 点 ， 并 需要 复制 一 部 分 树 。 
中 间 节 点 在 证 明 的 搜索 过 程 中 没什么 用 处 。 

Hal 完 全 省 略 了 中 间 结 点 。 部 分 证 明 树 只 包含 证 明 的 两 个 部 分 。 根 , 或 主 目标 (main goal), 
是 我 们 首先 设 定 要 证 明 的 公式 。 叶 子 ， 或 当前 子 目 标 (current subgoal)， 是 那些 还 没有 证 明 
的 相继 式 。 

目标 bg 和 单元 素 子 目标 表 [H 4 ] 组 成 的 序 偶 表 示 了 % 的 证 明 的 初始 状态 ， 尚 未 对 其 应 用 任 
何 规则 。 目 标 g 和 空子 目标 表 组 成 的 序 偶 是 结束 状态 ， 表 示 已 完成 的 证 明 。 

若 不 保存 完整 的 证 明 树 ， 我 们 如 何 确定 Hal 的 证 明 是 正确 的 呢 ? 答案 是 用 一 个 抽象 类 型 
state 来 隐藏 证 明 状态 的 具体 表示 ， 并 提供 有 限 的 操作 一 一 创建 初始 状态 ， 检 查 状 态 内 容 M 
试 结束 状态 ， 并 通过 某 个 推理 规则 将 一 个 状态 变换 到 另 一 个 状态 。 

如 果 需 要 更 高 的 可 靠 性 ， 那 么 可 以 将 证 明 保存 起 来 供 另 一 个 程序 检测 。 要 记 住 的 是 ， 真 
正 的 定理 证 明 可 能 会 非常 庞大 ， 再 多 的 机 器 检测 也 不 能 提供 绝对 的 可 靠 性 。 我 们 的 程序 和 证 
明 系 统 都 难免 会 出 错 ， 就 像 将 “现实 世界 ”的 任务 简化 为 逻辑 所 使 用 的 理论 一 样 。 
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Ol 推理 未 统 的 形式 化 方案 。 在 开发 爱丁堡 LCF 的 过 程 中 ，Robin Milner 产 生 了 将 扒 
理 系 统 定义 为 抽象 类 型 的 构想 。 他 设计 了 ML 的 类 型 系统 以 支持 这 种 应 用 。LCF 的 类 
型 fhm 代表 了 还 辑 定 理 的 集合 。 以 thm 作 为 返回 类 型 的 函数 则 实现 了 公理 和 推理 规则 。 

将 推理 规则 实现 为 从 定理 到 定理 的 函数 ， 这 种 方法 支持 正 向 证 明 ， 是 LCF 的 主要 
论证 方式 。 为 了 支持 反 向 证 明 ，LCF 提 供 了 策略 。LCF 策 略 通过 一 个 类 型 为 thm list 一 
ipma 的 函数 表示 了 部 分 证 明 。 当 提供 了 关于 各 个 子 目 标的 定理 后 ， 这 个 函数 可 以 通过 
推理 规则 证 明 主 目标 。 一 个 完成 的 证 明 只 要 接受 一 个 空 表 就 可 以 证 明 主 目标 。 有 关 
的 原始 描述 (Gordon 等 ，1979) 已 经 绝版 了 ， 但 是 我 的 一 本 关于 LCE 的 书 也 描述 了 
这 方面 的 工作 (Paulson，1987 ) 。 

Hal 和 LCE 的 不 同 在 于 它 将 推理 规则 实现 为 证 明 状 态 上 的 函数 ， 而 不 是 定理 上 的 
沪 数 。 这 些 沪 数 本 身 就 是 策略 ， 并 支持 反 向 证 明 。 他 们 不 支持 正 向 证 明 。 这 一 方案 
还 支持 合 一 ， 策 略 可 以 更 新 证 明 状 态 中 的 元 变量 。 

Isabelle (Paulson, 1994) 使 用 了 另 一 个 方案 。 规 则 和 证 明 状 态 在 类 型 化 -演算 
中 具有 相同 的 表示 法 。 将 这 些 对 象 组 合 既 可 产生 正 向 证 明 又 可 产生 反 向 证 明 。 这 需 
RRA AW RMS— (Huet, 1975), 


109 ML 签名 


签名 RULE 描 述 了 证 明 状态 的 抽象 类 型 ， 以 及 它 的 操作 (图 10-6)。 每 个 类 型 为 siate 的 值 
都 包含 了 一 个 公式 〈 主 目标 ) 和 一 个 相继 式 表 〈 子 目标 )。 每 个 状态 还 包含 了 额外 的 信息 以 供 
内 部 使 用 ， 尽 管 我 们 从 签名 中 看 不 出 来 。 


signature RULE = 
sig 
type state 
type tactic = state -> state ImpSeq.t 
val main : state -> Fol.form 
val subgoals : state -> Fol.goal list 
val initial : Fol.form -> state 
val final : state -> bool 
val basic : int -> tactic 
val unify : int -> tactic 
val conjL : int -> tactic 
val conjR : int -> tactic 
val disjL ; int -> tactic 
val disjR : int -> tactic 
val impL : int -> tactic 
val impR : int -> tactic 
val negL : int -> tactic 
val negR : int -> tactic 
val iffL : int -> tactic 
val igR : int -> tactic 
val allL : int tactic 
val allR : int tactic 
val exL : int tactic 
val exR : int tactic 
end; 





图 10-6 签名 RULE 
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类 型 tactic 是 函数 类 型 
State > state ImpSeq.t 

的 缩写 ， 其 中 ImpSeq 是 8.4 节 给 出 的 惰性 表 结构 。 一 个 策略 将 一 个 状态 映射 到 一 个 可 能 的 后 续 
状态 序列 上 上 。 原 始 策略 产生 有 穷 序 列 ， 通 常 长 度 为 零 或 一 。 一 个 复杂 的 策略 ， 比 如 识 度 优先 
搜索 ， 可 以 产生 状态 的 无 穷 序 列 。 

函数 iiia! 创 建 了 初始 状态 ， 其 中 包含 作为 主 且 标的 已 知 公式 ， 和 唯一 的 子 上 县 标 。 谓 词 
final 测 试 一 个 证 明 状 态 是 否 为 结束 状态 ， 也 就 是 不 包含 任何 子 目 标 。 

签名 中 的 其 他 函数 都 是 原始 策略 ， 它 们 定义 了 相继 式 演 算 的 推理 规则 。 稍 后 将 引入 策略 
算 子 (tactical) 来 对 策略 进行 组 合 。 

证 明 状 态 中 的 子 目 标 从 1 开始 编号 。 每 个 原始 策略 ， 在 给 定 一 个 整数 参数 i 和 一 个 状态 后 ， 
都 对 子 目标 ;应 用 相继 式 演 算 的 某 个 规则 ， 创 建 出 一 个 新 的 状态 。 例 如 ， 调 用 

conjL 3 st 

对 状态 st 中 的 子 目 标 3 应 用 和 A:left。 如 果 这 一 子 目标 形 如 gAy,TH A， 则 后 续 状 态 的 子 目 标 3 
将 是 8, y Tr A。 否 则 ， 和 :left 不 能 应 用 到 该 子 目标 上 ， 也 就 没有 后 续 状 态 ， 这 时 com 有 会 返 
回 空 序列 。 

如 果 st 的 子 目 标 5 是 T FF A SAY, BA 

conjR 5 st 

将 构造 一 个 新 的 状态 ， 其 子 目标 5 是 + _A, g， 子 目标 6 是 F + A y。 在 原来 的 st 中 编号 大 于 5 
的 子 目 标 编号 将 疝 后 移 。 

调用 basic i st 检测 状态 st 中 的 子 目 标 是 否 为 基本 相继 式 。 如 果子 目标 i 中 两 边 有 相同 的 公 
式 ， 则 将 该 子 目标 从 后 续 状 态 中 删 去 。 否 则 ， 这 一 策略 返回 空 序 列 以 示 失 败 。 对 基本 相继 式 
更 为 精细 的 处 理 是 策略 xn 办 . 

调用 unify i st 试图 通过 将 状态 st 中 的 子 目 标 ; 转 换 为 一 个 基本 相继 式 来 对 子 目 标 i 进 行 求解 。 
如 果 该 策略 能 将 左 侧 的 一 个 公式 与 右 侧 的 一 个 公式 合 一 ， 那 么 它 将 删除 子 目 标 i， 并 将 合 一 得 
出 的 替换 应 用 到 证 明 状 态 的 剩余 部 分 。 有 可 能 存在 几 个 不 同 的 可 合 一 的 公式 对 ， 将 uni 及 应 用 
到 子 目 标 


Pa), P(?b) F P(f (0)), P(c) 


产生 四 个 后 续 状态 的 序列 。 只 有 第 一 个 会 被 计算 ， 其 他 的 只 在 需要 时 才 进 行 计 算 ， 这 是 因为 
序列 是 惰性 的 。 


10.10 用 于 基本 相继 式 的 策略 


结构 Rule 是 分 儿 部 分 给 出 的 。 第 一 部 分 (图 10-7) 定义 了 类 型 state 的 表示 法 ， 及 其 基本 操 
作 ， 并 且 声 明了 用 于 基本 相继 式 的 策略 。 

声明 类 型 stale。datatype 声 明 引 入 了 类 型 state 和 它 的 构造 子 State。 该 构造 子 不 被 输出 ， 使 
得 只 能 在 结构 体内 访问 类 型 的 具体 表示 。 声 明 类 型 tactic 来 缩写 从 状态 到 状态 序列 的 函数 类 型 。 

函数 main 和 subgoals 返 回 了 证 明 状 态 的 相应 部 分 。 证 明 状 态 的 第 三 个 分 量 是 一 个 整数 ， 用 
于 生成 量词 规则 中 的 具 唯 一 性 的 名 字 。 它 的 值 从 0 开始 ， 并 在 后 续 状 态 创 建 时 按 需 要 递增 。 如 
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果 这 一 名 字 计 数 器 存放 在 一 个 引用 单元 中 ， 并 用 赋值 来 更 新 ， 那 么 许多 代码 会 得 到 简化 一 一 
特别 是 在 没有 用 到 计数 器 的 地 方 。 然 而 ， 将 量词 规则 应 用 到 一 个 状态 上 时 ， 会 影响 共享 那个 
引用 的 所 有 状态 。 将 计数 器 请 90， 虽然 可 以 生成 较 短 的 名 字 ， 也 可 能 导致 名 字 被 重用 以 及 错误 
的 论证 。 最 安全 的 还 是 保证 所 有 策略 都 是 纯 国 数 式 的 。 
















structure Rule 
struct 


datatype state = State of Fol.goal list * Fol.form * int 


:> RULE = 








type tactic = state -> state ImpSeq.t; 





fun main (State (gs,p,_)) 
and subgoals (State(gs,p,_)) 


P 
8s; 





fun initial p = State({ 








([], [pl) 1, p, 0); 
fun final (State(gs,_,_)) = null gs; 











fun spliceGoals gs newgs i = 





List .take (gs, i-1) @ newgs @ List.drop(gs,i); 


fun propRule goalF i (State(gs,p,n)) = 
let val gs2 = spliceGoals gs (goalF (List.nth(gs,i-1))) i 
in ImpSeq.fromList [State(gs2, p, n)] end 
handle _ => ImpSeq.empty; 

















val basic = propRule 

(fn (ps,qs) => 
if List.exists (fn p => List.exists (fn q => p=q) qs) ps 
then Í] else raise Match); 


unifiable ({], _) 








ImpSeq . empty 


| unifiable (p::ps, qs) 
let fun find [] = unifiable (ps,qs) 
| find (q::qs) = ImpSeq . cons (Unify .atoms (p,q), £n()=> find qs) 


handle Unify.Failed => find qs 
in find qs end; 


inst env (gs,p,n) = 
State (map (Unify.instGoal env) gs, Unify.instForm env p, n); 


fun unify i (State(gs,p,n)) = 
let val (ps,qs) = List. nth(gs,i-1) 

fun next env = inst env (spliceGoals gs [] i, p, n) 
in ImpSeq.map next (unifiable(ps,qs)) end 
handle Subscript => ImpSeq . empty; 








fun 


图 10-7 Rule 的 第 一 部 分 一 一 用 于 基本 相继 式 的 策略 


调用 initial p 创 建 一 个 状态 仅 包 含 相继 式 F_p 作 为 它 唯一 的 子 目 标 ， 并 且 将 p 作 为 主 目标 ， 
0 作为 变量 计数 器 。 谓 词 /fina! 用 来 测试 子 目 标 表 是 否 为 空 。 

basic 和 unify 的 定义 。 所 有 策略 都 是 用 函数 spliceGoals 来 表示 的 ， 它 将 一 个 状态 中 的 子 目 
标 ; 蔡 换 成 一 系列 新 的 子 目标 。List 的 函数 lake 和 drop 分 别 用 于 提取 出 ;之 前 和 ;之 后 的 子 目 标 ， 
使 得 那些 新 的 子 目标 可 以 被 拼接 在 正确 的 位 置 上 。 

propRule 的 声明 说 明了 证 明 状态 是 怎样 被 处 理 的 。 这 个 函数 根据 类 型 为 goal goal listh) 
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函数 goalF 生 成 一 个 策略 。 将 该 策略 应 用 到 整数 i 和 状态 上 时 ， 它 将 子 目标 :提供 给 soalF 并 将 其 
结果 拼接 回去 ， 它 将 新 状态 作为 一 个 单元 素 序列 返回 。 如 果 其 中 出 现 异常 ， 它 将 返回 一 个 空 
序列 。 如 果 不 存在 第 个子 目标 ， 调 用 List .nth(gs，i-1) 会 抛 出 异常 Subscript， 要 注意 函数 nth 
对 表 元 素 是 从 零 开 始 编号 的 。 其 他 异常 ， 如 Match， 可 能 会 从 goalF 中 抛 出 。 

策略 basic 是 propRule 的 简单 应 用 。 它 将 一 个 测试 目标 (ps, 9s) 是 否 为 基本 相继 式 的 函数 作 
为 goalF 传 信 。 如 果 是 ， 则 返回 一 个 空 的 子 目 标 表 ， 共 效果 就 相当 于 从 后 续 状 态 中 删除 原先 的 
子 目标 。 但 如 果 (ps, qs) 不 是 一 个 基本 相继 式 ， 则 函数 抛 出 异常 。 

策略 uni 及 则 更 为 复杂 : 它 能 返回 多 个 后 续 状态 。 它 调用 unifiable 来 生成 合 一 环境 的 序列 ， 
并 调用 inst 将 它们 应 用 到 其 他 子 目 标 上 。 函 数 next 进 行 最 后 的 处 理 ， 它 是 通过 算 子 ImpSeq.map 
来 应 用 的 。 

函数 unifiable 接 受 公 式 表 ps 和 qs。 将 ps 中 的 某 些 p 与 4s 中 的 某 些 q 进 行 合 一 ， 由 函数 
unifiable 返 回 得 到 的 所 有 环境 序列 。 函 数 find 处 理 “ 内 循环 ”， 在 qs 中 搜索 元 素 与 p 合 一 。 它 产 
生 一 个 序列 ， 其 首 元 素 是 一 个 环境 ， 其 尾部 将 由 递归 调用 find qs 生成 ,但 是 车 Unify.atoms 抛 出 
异常 ， 则 结果 只 是 find qs. 


A 注意 其 他 目标 。 当 uni 户 解决 了 一 个 子 目 标 后 ， 它 可 能 会 更 新 状态 ， 使 得 其 他 子 
目标 变 得 不 可 证 明 。 这 一 策略 的 成 功 并 不 保证 它 是 找到 一 个 证 明 的 正确 途径 ， 在 某 
些 情形 中 ， 要 撞 用 另 一 种 不 同 的 策略 。 任 何 涉及 unify 的 搜索 过 程 都 应 使 用 回 湖 。 另 
一 方面 ， 通 过 basic 解 决 一 个 目标 总 是 安全 的 。 


练习 10.21 给 出 一 个 例子 来 证 明 上 面 的 警告 是 有 道理 的 。 


10.11 命题 策略 


Rale 的 下 一 部 分 实现 了 A、V 、”、、 一 和 *> 的 规则 。 由 于 每 个 连接 词 都 有 “ 左 ” 规 则 
和 “ 右 ” 规 则 ， 所 以 总 共有 10 个 策略 。 见 图 10-8。 

这 些 策略 使 用 了 同样 的 基本 机 制 。 在 给 定 的 左 侧 或 右 侧 搜索 适合 的 公式 ， 取 下 其 中 的 连 
接 词 ， 根 据 连接 词 的 操作 数 产生 新 的 子 目标 。 每 个 策略 如 果 成 功 都 返回 单一 的 后 续 状 态 。 如 
果 找 不 到 适合 的 公式 ， 则 策略 失败 ， 返 回 空 的 状态 序列 。 在 propRuwle 和 另 一 个 新 图 数 
splitConn 的 辅助 下 ， 我 们 可 以 简明 地 表达 这 些 策略 。 

举例 来 说 明 splitConn 是 怎样 工作 的 。 给 定 字符 串 "&" 和 公式 表 9gs ， 这 个 函数 将 寻找 匹配 
Conn("&"，ps) 的 第 一 个 元 素 ， 如 果 找 不 到 就 抛 出 异常 Matrch。 它 还 复制 除去 匹配 元 素 外 的 qs。 
它 返 回 ps 和 缩短 的 gs。 注 意 ,， 现 在 ps 包含 了 被 选 出 的 公式 的 操作 数 。 

算 子 propL 辅 助 表示 相继 式 规则 。 对 给 定 的 相继 式 ， 它 将 在 其 左 侧 搜索 连接 词 。 并 将 
splitConn 的 调用 结果 提供 给 另 一 个 负责 创建 新 子 目 标的 函数 leftF。 算 子 propR 与 之 类 似 ， 只 不 
过 是 在 右 侧 搜索 。 

这 些 策略 由 val 声 明 给 出 ， 因 为 它们 没有 显 式 的 参数 。 每 个 策略 由 一 个 propL 或 propR 的 
调用 构成 。 每 个 调用 在 fn 记 法 中 传人 参数 leftF 或 rightF。 每 个 函数 接受 一 个 分 解 出 来 的 子 目 
标 并 返回 一 个 或 两 个 子 目标 。 由 此 ，conjL 在 左 侧 搜索 一 个 合 到 式 ， 并 将 两 个 合 取 项 插入 新 的 
子 目标 ， 而 conjR 则 在 右 侧 搜 索 一 个 合 取 式 ， 并 生成 两 个 子 目标 。 
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fun splitConn a qs 
let fun get [] = raise Match 












| get (Fol.Conn(b,ps) :: qs} = if a=b then ps else get qs 
| get (q::qs) = get qs; 
fun del (J = [] 
| del ((g as Fol.Conn(b,_)) :: qs) = if a=b then gs 
else q :: del qs 
| del (q::qs) = q :: del qs 


in (get qs, del qs) end; 
fun propL a leftF = propRule (fn (ps,qs) => leftF (splitConn a ps, qs))i 
fun propR a rightF = propRule (fn (ps,qs) => rightF (ps, splitConn a qs)); 
val conjL = propL *&" (fn (({pl,p2], ps), qs) => ((pl::p2::ps, qs)1)i 
val conjR = propR "&" 
(fn (ps, ({ql,q2], qs)) => ((ps, ql::4s), (ps, g2::q4s)1)i 
val disjL = propL "|" 
(fn (((pl,p21, ps), qs) => [(pl::ps, gs),  (p2::ps, qs)1)i 
disjR 





= propR "|" (fn (ps, ({ql,g2], 95)) => U(ps, qh::q2::qs)1); 










impL = propL "-->" 
(fn (({pl,p2], ps), qs) => [(p2::ps, qs), (ps, p\::qs))); 





val impR = propR “-->* (fn (ps, ({ql,q2]. qs)) => [(gl;:ps, q2::qs)1); 





val negL = propL "~" (fn (({pl, ps). qs) => ((ps, p::q5)}); 





negR = propR "~" (fn (ps, ((q]. qs)) => ((q::ps, qs) l); 












iffL = propL "<->" 
(fn ((Ipl,p2], ps). qs) => U(pt::p2::ps, qs), (ps, pli:p2::9s))); 







val iffR = propR "<->" 
(fn (ps, ({ql,g2}, qs)) => [(gl::ps, q2z:qs),  (q2::ps, ql::q8s)1); 





图 10-8 Rule 的 部 分 一 一 命题 策略 


10.12 量词 策略 


上 面 所 给 出 的 机 制 可 以 容易 地 修改 以 表示 量词 策略 ， 不 过 和 命题 的 情况 有 几 点 不 同 。 代 
码 在 图 10-9 中 ， 加 上 它 就 完成 了 整个 Rule 结 构 。 

函数 splitQuant 与 splitConn 非 常 类 似 。 它 用 来 寻找 第 一 个 含有 指定 量词 ("ALL" 或 "EX") 
的 公式 。 它 返回 整个 公式 (而 不 是 只 有 操作 数 ) ， 因 为 某 些 量词 策 略 将 在 子 目 标 中 保留 它 。 

虽然 我 们 的 相继 式 演算 是 用 多 重 集合 定义 的 ， 但 它 却 是 用 表 实 现 的 。 相 继 式 中 的 公式 是 
有 顺序 的 ， 如 果 表 中 有 了 两 个 满足 要 求 的 公式 ， 那 么 将 找到 最 左边 的 。 为 了 遵守 多 重 集合 的 概 
念 ，Hal 不 提供 重新 排序 公式 的 方法 。 量 词 策略 保证 没有 公式 会 永远 被 排除 在 外 。 

这 些 策略 需要 一 个 全 新 名 字 的 来 源 ， 以 命名 变量 和 参数 。 调 用 letrer n， 其 中 0 < n< 25， 
返回 从 "a" 到 "z" 的 单字 符 字符 串 。 函 数 gemsym 一 一 函数 名 出 自古 老 的 Lisp 一 一 根据 自然 数 产 
生 一 个 字符 捉 。 它 的 结果 是 一 个 26 进 制 数 ， 其 中 的 “数字 ”是 小 写字 母 ， 前 缀 " "防止 和 外 
部 提供 的 名 字 冲 突 。 

算 子 quantRule 根 据 函 数 goalF 产 生 一 个 策略 。 它 提供 一 个 子 目 标 和 一 个 新 名 字 给 goalF， 
goalF 相 应 地 具有 类 型 goal x string goal list。 当 构造 后 续 状 态 时 ， 它 还 要 递增 变量 计数 器 。 
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其 他 方面 ，quantRule 和 propRule 完 全 一 样 。 












fun splitQuant qnt as = 
let fun get [] = raise Match 
| get ((q as Fol. Quant(qnt2,_,p)) :: qs) = if gnt=qnt2 then q 
else get qs 
| get (q::qs) = get qs; 
fun del [] = [] 
| del ((q as Fol.Quant(qnt2,_,p)) :: qs) = if qnt=qnt2 then qs 
else q :: del qs 
q :: del qs 







| del (q::qs) 
in (get qs, del qs) end; 












fun lerner n 





= String. substring ("abcdefghijkimnopgrstuvwxyz", n, 1) 






fun gensym n = 
if n<26 then "_" ^ letter n 
else gensym(n div 26) ^ letter(n mod 26); 






fun quantRule goalF i (State(gs,p,n)) = 

let val gs2 = spliceGoals gs (goalF (List.nth(gs,i-1), gensym n)) i 
in ImpSeq .fromList [State (gs2, p. n+1)] end 

handle _ => ImpSeq.empty; 


allL = quantRule (fn ((ps,qs), b) => 

let val (qntForm as Fol.Quant(_,_.p), ps’) = splitQuant "ALL" ps ` 
val px = Fol.subst 0 (Fol.Var b) p 

in [(px :: ps’ @ [qntForm], gs)] end); 


allR = quantRule (fn ((ps,qgs), b) => 
let val (Fol. Quant(_,_.q), qs’) = splitQuant "ALL" qs 
val vars = Fol.goalVars ((ps,qs), [}) 
val qx = Fol.subst 0 (Fol.Param(b, vars)) q 
in [(ps, qx::qs’')} end); 
























val exL = quantRule (fn ((ps,qs), b) => 
let val (Fol. Quant(_,_,p), ps’) = splitQuant "EX" ps 
val vars = Fol.goalVars ((ps,qs), {]) 
val px = Fol.subst O (Fol.Param(b, vars)) p 
in [(px::ps’, gs)] end); 








val exR = quantRule (fn ((ps,qs), b) => 

let val (qntForm as Fol.Quant(_,_.q), q5) = splitQuant "EX" qs 
val qx = Fol.subst 0 (Fol.Var b} q 

in [(ps, qx :: gs @ [qntForm])) end); 


图 10-9 ”Rule 的 最 后 部 分 一 一 量词 策略 


每 个 策略 都 表示 为 quantRule 对 一 个 冰 数 的 应 用 ,该 函数 使 用 fn 记 法 ， 它 接受 子 自 标 (ps， 
qs) 和 一 个 新 名 字 b， 并 返回 一 个 子 目标 。 
策略 al 此 和 exR 用 于 展开 一 个 量化 公式 。 它 们 将 一 个 名 字 为 8 的 变量 替换 进 公式 体 。 它们 包 
括 子 目标 中 的 量化 公式 〈 通 过 as 绑 定 到 gmtForm)。 公 式 被 放 在 表 的 最 后 ， 以 便 其 他 量化 公式 
可 以 在 下 一 次 策略 应 用 时 被 选 上 。 
策略 a1R 和 ex 选择 一 个 量化 公式 并 将 一 个 参数 替换 进 公 式 体 。 该 参数 名 字 为 b， 并 带 有 子 [427 
且 标 中 的 所 有 变量 作为 禁止 变量 。 429 
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当 我 们 读 到 Rule 结 尾 时 应 该 记得 ， 其 中 声明 的 策略 只 是 创建 类 型 sfare 值 的 方法 。 所 有 证 
明 过 程 一 一 即便 它们 通过 深奥 的 数据 结构 说 明了 其 有 效 性 一 一 最 终 必 须 应 用 这 些 策略 来 构造 
一 个 形式 证 明 。 如 果 上 面 给 出 的 代码 是 正确 的 ， 并 且 ML 系 统 是 正确 的 ， 那 么 Hal 的 证 明 就 可 
以 保证 是 正确 的 。 从 此 之 后 的 编码 错误 都 不 会 导致 错误 的 证 明 。 这 种 可 靠 性 是 由 于 我 们 已 将 
state 定 义 为 一 个 抽象 类 型 。 
练习 10.22 ”建议 一 种 可 以 存储 整个 证 明 树 的 类 型 state 的 表示 法 。 最 好 是 使 用 一 种 编码 ， 在 不 
占 多 少 空间 的 同时 允许 重 构 证 明 树 。 概 述 对 于 RULE 和 Rule 所 作出 的 修改 。 
练习 10.23 我们 的 这 套 策略 没有 提供 在 证 明 中 使 用 已 经 证 明定 理 的 方法 。 基 于 规则 
Ho p, PKA 
TFA 


BSE BS BT EB AEAT Be. SO REEE LXE TR. 


练习 10.24 “结构 Rule 没 有 涉及 ParseFol 或 DisplayFol， 因 此 语法 分 析 和 美化 打印 中 的 错误 
不 会 导致 错误 证 明 的 构造 。” 评价 这 一 观点 。 


搜索 证 明 


大 部 分 程序 设计 都 已 经 被 抛 在 我 们 身后 了 。 我 们 就 要 准备 在 机 器 上 尝试 证 明了 。 我 们 要 
实现 一 套 命令 来 将 策略 应 用 到 一 个 目标 上 。 这 里 将 要 说 明 如 何 处 理 证 明 状态 ， 也 会 暴露 元 长 
乏味 的 逐条 规则 的 证 明 检测 。 策 略 算 子 ， 通 过 为 策略 提供 控制 结构 ， 将 允许 我 们 用 短 短 几 行 
代码 来 表示 自动 定理 证 明 机 。 


10.13 变换 证 明 状 态 的 命令 


用 户 界 面 并 不 采用 从 终端 读 和 数据， 而 是 由 一 套 命令 组 成 的 ， 这 套 命令 可 以 在 ML 顶层 调 
用 。 这 是 策略 定理 证 明 机 惯用 的 做 法 。 最 重要 的 命令 就 是 “应 用 一 个 策略 ” ， 并 且 该 策略 可 以 
由 任意 一 个 ML 表达 式 给 出 ， 因 此 ， 命 令 语言 是 ML 本 身 。 请 记 住 ，ML 代 表 元 语言 (Meta 
Language ) 。 

Hal 的 界面 是 粗糙 的 。 它 仅仅 提供 命令 来 设 定 、 更 新 和 检查 存储 证 明 状态 。 实 用 的 定理 证 
明 需 要 额外 的 功能 ， 例 如 用 一 个 undo 命 令 来 回复 到 一 个 先前 的 状态 。 由 于 一 个 策略 可 能 返回 
多 个 后 续 状 态 ， 策 略 的 应 用 定义 了 一 棵 以 初始 状态 为 根 的 搜索 树 。 图 形 用 户 界 面 会 提供 办 法 
来 芳 察 这 棵 树 。 为 了 保持 代码 简单 ， 这 些 功 能 留 作 练习 。 有 些 ML 系 统 可 以 和 像 TcMTk 这 样 的 
脚本 语言 通信 ， 使 得 在 屏幕 上 放置 窗口 和 菜单 变 容易 了 。 良 好 的 界面 设计 还 需要 对 用 户 工 作 
习惯 的 仔细 研究 。 


签名 COMMAND 描 述 了 用 户 界面 : 
signature COMMAND = 
sig 
val goal : string -> unit 
val by : Rule .tactic -> unit 
val pr : Rule.state -> unit 


O “这 -规则 是 “cut” 的 一 种 特殊 情形 ， 它 的 第 一 个 前 提 可 以 是 F FA g 
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val getState : unit ~> Rule.state 


end; 
界面 由 下 面 几 项 组 成 ， 它 们 (除了 pr) sist, tae Watney 
。goal 命 令 接 受 一 个 通过 字符 串 给 出 的 公式 9， 它 习 入 存储 证 明 关 起 为 4 的 初始 拓 态 ， 


。by 命 令 应 用 一 六 如 果 返 回 的 后 续 状 态 序列 不 为 空 ， 那 么 它 的 首 元 素 
会 被 取出 来 更 新 存储 证 明 状 态 。 否 则 ， 该 策略 失败 ， 显 示 一 条 错误 信息 。 

。Pr 命 令 打 印 它 的 参数 ， 也 就 是 一 个 证 明 状态 ， 到 终端 上 。 

。 国 数 getStare 返 回 存储 证 明 状 态 。 


结构 Command 实 现 了 这 些 项 (图 10-10)。 当 前 状态 存储 在 一 个 引用 单元 中 ， 初 始 化 为 虚构 的 
目标 "No goal yet!". 


structure Command : COMMAND = 
struct 


val currState = ref (Rule.initial (Fol.Pred("No goal yet!",{]))); 
fun question (s,z) = " ?" :: Sot: z; 


fun printParam (a, []) = () (* 打印 参数 表格 的 一 行 *) 
| printParam (a,ts) = 
print (String.concat (a :: " not in" 
foldr question ["\n"] ts)); 


() 
(DisplayFol.goal n g; printGoals (n+1,gs)); 


fun pr st = (* 打印 一 个 证 明 状 态 *) 
let val p = Rule.main st 
and gs = Rule.subgoals st 
in DisplayFol.form p; 
if Rule.final st then print "No subgoals left!\n" 
else (printGoals (1, gs); 
app printParam (foldr Fol.goalParams [] gs)) 


fun printGoals (_, []) 
| printGoals (n, g::gs) 


end; 
(* 打印 新 状态 ， 然 后 设 它 为 当前 状态 *) 
fun setState state = P state; currState := state) ; 


val goal = setState o Rule initial o ParseFol. read; 


fun by tac = setState (ImpSeq.hd (tac (!currState) ) ) 
handle ImpSeq.Empty => print “** Tactic FAILED! **\n" 


fun getState() = !currState; 
end; 





图 10-10 用 户 界面 命令 


回忆 可 知 ， 一 个 参数 ， 如 bre, 只 被 显示 为 b。 界 面 将 每 一 个 参数 和 它 的 禁止 变量 显示 在 一 
个 表格 中 。 函 数 printParam 打 印 这 样 一 行 


b not in ?c ?Q 


代表 4b;.. ww， 对 于 一 个 没有 禁止 变量 的 参数 来 说 什么 也 不 打印 。 函 数 printGoals 打 印 一 个 带 编 号 
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的 子 目 标 表 。 在 这 些 函 数 的 辅助 下 ，Pr 将 打印 一 个 状态 : 它 的 主 目标 、 子 目标 表 ， 以 及 参数 
表格 。 


练习 10.25 ”设计 和 实现 一 个 wndo 命 令 ， 取 消 最 近 一 次 by 命令 的 效果 。 重 复 undo 命 令 应 该 回 
复 到 越 来 越 早 的 状态 。 


练习 10.26 ”有 很 多 方法 可 以 管理 状态 搜索 树 。 界 面 可 以 考察 树 中 的 一 条 路 径 。 每 个 结 点 会 
存储 一 个 可 能 的 后 续 状 态 序列 ， 将 其 中 一 个 作为 活动 分 支 。 改 变 任 一 结 点 的 活动 分 支 都 将 选 
择 一 条 不 同 的 路 径 。 完 善 这 一 思想 。 


10.14 两 个 使 用 策略 的 证 明 实例 


为 了 演示 这 些 策略 和 用 户 界 面 ， 让 我 们 在 机 器 上 进行 一 些 证 明 。 为 了 便于 使 用 命令 ， 我 
们 打开 相应 的 模块 : 

open Command; 
现在 我 们 来 进行 证 明 。 第 一 个 例子 很 简单 ， 证 明 p 人 www 和 9。 8oal 命 令 将 这 个 公式 提供 给 
Hal。 

goal "P & Q --> Q& P"; 


> P&Q-->Q&P 
> 1. empty ]- P&Q-->Q&P 


现在 9 人 全 wwA 9 是 主 目标 ， 也 是 唯一 的 子 目标 。 我 们 必须 对 子 目 标 1 应 用 一 :right， 不 可 能 有 
其 他 步 又 : 
by (Rule.impR 1); 


> P&Q-->Q6&P 
> 1. P&Q j~- Q&P 


FARIRAGCAY F Ag， 这 我 们 已 经 在 纸 上 证 明 过 了 。 虽 然 对 这 个 目标 可 以 应 用 和 :right， 
但 是 和 :left 可 以 得 到 更 短 的 证 明 ， 因 为 它 只 产生 一 个 子 目 标 。 
by (Rule.conjL 1); 


>P&Q--> Q& P 
> 1. P,Q |- Q&P 


我 们 又 没有 其 他 选择 了 ，、 只 能 对 子 目 标 1 应 用 人 :right。 下 面 是 尝试 其 他 策略 的 结果 : 


by (Rule.disjR 1); 
> ** Tactic FAILED! ** 


这 回 使 用 A :right 了 。 它 产生 两 个 子 目标 。 


by (Rule.conjR 1); 

> P&Q--> Q& P 
> 1. bo /- Q 
> 2. P,Q l- P 


通常 都 对 子 目 标 1 应 用 策略 ， 让 我 们 试 试 子 目标 2，、 以 增加 一 些 变 化 。 这 是 一 个 基本 相继 式 ， 
所 以 它 属 于 Rule.basic。 


by (Rule.basic 2); 
>P&Q-->Q& P 
> 1. PQ l- Q 
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子 目 标 1 也 是 个 基本 相继 式 ， 把 它 解 决 将 终止 这 个 证 明 。 


by (Rule.basic 1); 
> P&Q--> Q& P 
> No subgoals left! 


大 多 数 定理 证 明 机 都 提供 一 些 方法 来 存储 证 明 过 的 定理 ， 但 是 在 Hal 中 不 行 。 
个 例子 ，3z.9(z) 一 Vx.$(x)， 之 前 曾 讨论 过 ，。 


goal "EX z. P(z) --> (ALL x. P(x))"; 
> EX z. P(z) --> (ALL x. P(x)) 
> 1. empty /- EX z. P(z) --> (ALL x. P{(x)) 


唯一 可 能 的 步骤 是 对 子 目标 1 应 用 3:right。 这 个 策略 生成 一 个 名 为 ?_a 的 变量 。 


by (Rule.exR 1); 

> EX z. P(z) --> (ALL x. P(x)) 

> 1. empty 

> l- P(?_a) --> (ALL x. P(x)), 

> EX z. P(z) --> (ALL x. P(x)) 


我 们 可 以 再 次 应 用 3:right， 但 是 看 上 去 分 析 子 目标 1 中 的 另 一 个 公式 更 为 合理 。 因 此 我 们 应 用 


一 :right。 


by (Rule.impR 1); 

> EX z. P(z) --> (ALL x. P(x)) 

> 1. P(?_a) 

> |- ALL x. P(x), 

> EX z. P(z) --> (ALL x. P{(x)) 


ARER- TAK, BURA Veright. iS AE Re ~  _DN BRM, ?_ awe 


变量 。 这 次 显示 参数 表格 了 。 


by (Rule.allR 1); 

> EX z. P(z) --> (ALL x. P(x)) 

> 1. EX z. P(z) --> (ALL x. P(x)) 
> P(?_a) |- P(_b), 

> _b not in ?_a 


由 于 子 目 标的 左 侧 包含 P(?_a) ， 右 侧 包含 P(_b) ， 因 此 我 们 可 以 尝试 通过 调用 Rule.uni 户 
来 合 一 这 些 公式 。 然 而 ，_b 的 禁止 变量 不 允许 这 种 合 一 。 用 _b 替 换 ?_a 违 反 了 Vi:right 的 限 


制 条 件 。 


by (Rule.unify 1); 
> ** Tactic FAILED! ** 


这 个 情况 与 开始 的 证 明 相 似 ， 只 不 过 子 目标 多 包含 了 两 个 新 的 原子 公式 。 由 于 它们 不 能 合 一 ， 


我 们 除了 再 次 应 用 3iright 展 开 量词 之 外 没有 其 他 选择 。 这 次 创建 了 变量 ?_c。 


by (Rule.exR 1); 

> EX z. P(z) --> (ALL x. P(x)) 

> 1. £P{(?_a) 

> l- P(?_c) --> (ALL x. P(x)), P(_b), 
> EX z. P(z) --> (ALL x. P(x)) 

> _b not in ?a 


我 们 继续 看 下 一 
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证 明 像 前 面 那 样 继续 进行 ， 并 带 着 那 两 个 原子 公式 。 为 了 避免 第 三 次 应 用 3:right， 我 们 应 用 
= :right。 

by (Rule.impR 1); 

> EX z. P(z) --> (ALL x. P{(x)) 

> 1. P(?_c), P(?_a) 

> |- ALL x. P(x), P(_b), 

> EX z. P(z) --> (ALL x. P(x)) 

> 


这 个 子 目标 在 左 侧 新 添 了 一 个 公式 P(?_c)， 并且?_c 不 是 _b 的 禁止 变量 。 因 此 ,，P(?_c) 与 
P(_b) 是 可 合 一 的 。 
by (Rule.unify 1); 


> EX z. P(z) --> (ALL x. P(x)) 
> No subgoals left! 


虽然 第 一 次 尝试 用 Ruie.wr 态 合 一 失败 了 ， 但 是 最 后 还 是 找到 了 一 个 成 功 的 证 明 。 这 也 说 明了 
实际 中 参数 和 变量 是 如 何 运转 的 。 


10.15 策略 算 子 


上 一 节 的 证 明 实例 异常 地 短 。 即 使 是 一 个 简单 公式 的 证 明 也 需要 很 多 步 。 为 了 说 服 自己 ， 
可 以 尝试 证 明 


(O e y) ex) elel ex) 


虽然 证 明 很 长 ， 但 每 一 步 都 很 明显 。 通 常 ， 只 有 一 至 两 条 规则 可 以 应 用 到 一 个 子 目 标 上 。 此 
外 ， 可 以 按 任 何 顺序 对 这 些 子 目标 进行 处 理 ， 因 为 一 个 成 功 的 证 明 必 须 证 明 它 们 全 部 。 我 们 
总 可 以 从 子 目标 1 着 手 。 一 个 好 的 证 明 过 程 可 以 用 策略 表达 ， 辅 以 一 些 控制 结构 。 

基本 策略 算 子 。 策 略 上 的 操作 称 为 策略 算 子 (tactical)， 类 似 于 函数 和 算 子 。 最 简单 的 策 
略 算 子 实现 了 上 顺序、 选择 和 重复 的 控制 结构 。 它 们 类 似 于 语法 分 析 操 作 符 --、| | 和 repeat 
《9.2 节 )。 因 此 它们 共享 同样 的 名 字 ， 另 外 还 有 一 个 中 绥 操 作 符 |e |。 

Hal 中 的 策略 算 子 包含 序列 上 的 操作 。 类 型 multifun 是 签名 (图 10-11) 中 类 型 的 缩写 。 策 
略 算 子 并 不 限于 策略 。 它 们 都 是 多 态 的 ， 类 型 state 没 在 任何 地 方 出 现 。 让 我 们 按照 这 些 策略 
算 子 在 任意 具有 合适 类 型 的 函数 上 的 作用 来 对 它们 进行 讲述 ， 而 不 只 是 针对 策略 。 

策略 算 子 -~ 顺序 地 复合 两 个 函数 。 当 函数 /--g 被 应 用 到 x 上 时 ， 它 计算 序列 f(x) = iy, 
y2，…]， 并 返回 序列 g(y1), 802), … 的 连接 。 给 定 两 个 策略 ，-- 应 用 一 个 策略 接着 应 用 另 一 个 
策略 到 一 个 狂 明 状态 上 ， 返 回 所 有 得 出 的 “后 续 的 后 续 ” 状 态 。 

策略 算 子 | | 在 两 个 函数 间 选 择 。 当 函数 f| |8 应 用 到 x 上 时 ， 如 果 序 列 fx) 非 空 ， 则 返回 
flx)， 否 则 返回 g(x)。 给 定 两 个 策略 ，| | 将 一 个 策略 应 用 到 一 个 证 明 状态 上 ， 如 果 失 败 ， 则 党 
试 另 一 个 策略 。 策 略 算 子 18 | 提供 不 那么 严格 的 一 种 选择 ， 当 将 f| 8@ | 8 应 用 于 x 时 ， 它 连接 序 
IOF). 

策略 acW 和 mo 可 以 和 策略 算 子 一 同 使 用 以 得 到 如 重复 之 类 的 效果 。 对 于 所 有 x，all(z) 返 回 
单元 素 序 列 fxz] ， 而 no(9 返 回 空 序列 。 因 此 al 对 所 有 实际 参数 都 成 功 ， 而 mo 则 不 会 成 功 。 注 意 ， 
al 是 -- 的 单位 元 : 
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all--f = f--all =f 
类 似 地 ，no 是 | | A| @ | 的 单位 元 。 


infix 5 --; 
infix 0 {| |e]; 
signature TACTICAL = 
sig 
type (‘a,’b) multifun = 'a -> 'b ImpSeq.t 
val -- : ('a,'b) multifun * ('b,'c) multifun -> (’a,'c) multifun 


val || : (‘a,'b) multifun * ('a,'b) multifun -> ('a,'b) multifun 
val |e] : (‘a,'b) multifun * (‘a,'b) multifun -> ('a,'b) multifun 


val all : ('a,'a) multifun 

val no : (Ua,'b) multifun 

val try : ('a,'a)multifun -> (‘'a,'a) multifun 

val repeat : (a,'a)multifun -> ('a,'a) multifun 

val repeatDeterm : ('a,’a)multifun -> ('a,'a) multifun 

val depthFirst : (‘a->bool) -> ('a,'a)multifun -> ('a,'a) multifun 

val depthiter : ('a->bool) * int -> (‘a,'a)multifun -> ('a,'a) multifun 
val firstF : (‘a -> ('b,'c)multifun) list -> ‘a -> ('b,'c) multifun 
end; 





图 10-11 签名 TACTICAL 


实现 策略 算 子 。 让 我 们 来 看 结构 Tactical (图 10-12)。 序 列 连接 所 扮演 的 角色 很 清楚 ， 但 
是 它 在 |8| 中 的 作用 是 隐 史 的 。 这 个 明显 的 定义 有 什么 问题 呢 ? 


fun (tacl |@| tac2) x = ImpSeq.append(tacl x, tac2 x); 


这 一 版 本 的 |e| 可 能 过 早 地 (或 没 必 要 的 ) 调用 了 tac2。 用 JmpSeq.concat 定 义 |8| 保 证 了 tac2 在 tacl 
产生 的 元 素 被 用 完 之 前 不 会 被 调用 。 在 一 种 惰性 语言 中 ，|e | 的 这 个 明显 的 定义 将 会 正确 工作 。 
structure Tactical : TACTICAL = 


struct 
type (‘a,'b) multifun = 'a -> 'b ImpSeq.t 


fun (tacl -- tac2) x = ImpSeq.concat (ImpSeq.map tac2 (tacl x)); 


fun (tacl || tac2) x = 
let val y = tacl x 
in if ImpSeq.null y then Iac2 x else y end; 


(tacl |@| tac2) x = 


ImpSeq . concat (ImpSeq.cons(tacl x, (* 延 时 对 tac2 的 应 用 ! *) 
fn()=> ImpSeq.cons(tac2 x, 
fn()=> ImpSeq.empty))); 


all x = ImpSeq.fromList [x] ; 
no x = ImpSeq.empty; 
try tac = tac || all; 


repeat tac x = (tac -- repeat tac || all) x; 





图 10-12 策略 算 子 
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fun repeatDeterm tac x = 
let fun drep x = drep (ImpSeq.hd (tac x)) 
handle ImpSeq.Empty => x 
in ImpSeq.fromList {drep x) end; 


fun depthFirst pred tac x = 
(if pred x then all else tac -- depthFirst pred tac) x; 


fun depthlter (pred,d) tac x = 
let val next = ImpSeq.toList o tac 
fun dfs i (y, sf) () = 
if i<0 then sf() 
else if i<d andalso pred y 
then ImpSeq.cons(y, foldr (dfs (i-1)) sf (next y)) 
else foldr (dfs (i-1)) sf (next y) () 
fun deepen k = dfs k (x, fn()=> deepen (k+d)) () 
in deepen 0 end; 


fun orelseF (tacl, tac2) u = tacl u || tac2 u; 


fun firstF ts = foldr orelseF (fn _ => no) ts; 
end; 





图 10-12 (4%) 


策略 算 子 try 试 图 应 用 它 的 参数 。 

策略 算 子 repeat 重 复 地 应 用 一 个 函数 。repeat /zx 的 结果 是 一 个 序列 ， 其 中 的 元 素 值 是 从 x 
开始 通过 重复 应 用 上 而 得 到 的 ， 这 一 重复 直到 进一步 应 用 导致 失败 为 止 。 这 个 策略 算 子 是 递 
归 定 义 的 ， 就 像 相 应 的 语法 分 析 操 作 符 。 

策略 算 子 repeatDeterm 也 提供 重复 。 它 是 确定 的 ， 它 只 考虑 每 一 步 返 加 的 第 一 个 结果 。 当 
不 需要 其 他 结果 时 ，repeatDererm 比 repeat 要 高 效 得 多 。 

策略 算 子 depthFirst 探 索 由 函数 生成 的 搜索 树 。 调 用 depthFisrt pred f x 返回 一 个 值 的 序列 ， 
其 中 的 元 素 值 都 满足 谓词 pred， 它 们 是 从 x 开始 通过 重复 应 用 /而 得 到 的 。 

策略 算 子 depthIter 使 用 深度 优先 迭代 深化 来 搜索 树 。 它 首先 搜索 到 深度 4d， 其 次 到 2d4， 然 
后 到 3d， 依 此 类 推 、 这 保证 不 会 错过 任何 的 解 。 函 数 的 其 他 参数 和 depthFirst 中 的 一 样 。 它 是 
基于 5.20 节 所 讨论 的 代码 来 实现 的 ， 相 当 混 乱 。 

最 后 ，firstF 是 一 个 组 合 原始 推理 规则 的 方便 途径 ， 见 图 10-13。. 

一 些 例 子 。 为 了 演示 这 些 策略 算 子 ， 首 先 打 开 它 们 的 结构 ， 使 得 其 中 的 中 缀 操作 符 可 用 。 


open Tactical; 
现在 让 我 们 来 证 明 下 面 的 公式 ， 这 是 合 取 的 结合 律 : 

goal "(P & Q) & R --> P& (Q& R)"; 

> (P & Q) & R --> P& (Q & R) 

> 1. empty |- (P&Q) & R --> P & (Q & R) 
唯一 可 应 用 的 规则 是 -~ :right。 再 多 看 一 点 儿 ， 我 们 可 以 预测 要 应 用 两 次 人 :left。 通 过 repeat 可 
按 需 应 用 这 两 条 规则 : 

by (repeat (Rule.impR 1 || Rule.conjL 1)); 


> (P&E Q) & R--> P& (Q & R) 
> 1. P,Q, R |- PE (Q & R) 


现在 必须 应 用 两 次 人 入:right。 我 们 不 断 地 将 Rule .basic 和 相应 的 规则 一 起 应 用 ，Rule.basic 用 来 





策略 定理 证 明 机 333 


探测 基本 相继 式 : 


by (repeat (Rule.basic 1 || Rule.conjR 1)); 

> (P&Q) & R--> P& (Q & R) 

> No subgoals left! 
只 用 了 两 次 by 命令 就 证 明了 这 条 定理 ， 如 果 一 条 条 地 使 用 规则 将 会 需要 8 次 命令 。 为 了 做 另 一 
个 演示 ， 让 我 们 来 构造 一 个 精致 的 策略 来 证 明定 理 。 还 用 我 们 熟悉 的 量词 的 例子 : 

goal "EX z. P(z) --> (ALL x. P(x))"; 


> EX z. P(z) --> (ALL x. P(x)) 
> 1. empty |- EX z. P(z) --> (ALL x. P(x)) 


我 们 把 10.14 节 中 使 用 过 的 那些 策略 放 在 一 起 进行 重复 ， 要 小 心 选择 它们 的 顺序 。 显 然 应 
该 首先 尝试 Rule.unify， 因 为 它 可 能 一 下 子 就 将 目标 解决 。Rule.exR 必 须 放 在 最 后 ， 否 则 它 每 
次 都 会 被 应 用 而 导致 死 循环 。 

by (repeat (Rule.unify 1 || Rule.impR 1 | | 

Rule.allR 1 || Rule.exR 1)); 


> EX z. P{z) --> (ALL x. P(x)) 
> No subgoals left! 


Ol R4KF AX. RGHFRRF RT ELCE (Gordon 等 ，1979)。 类 似 的 控制 结构 出 
现在 重 写 中 (Paulson，1983)， 用 于 表达 称 为 转 挽 (conversion) 的 重 写 方法 。HOL 系 统 依赖 
于 这 一 方案 进行 重 写 (Gordon 和 Melham，1993， 第 23 章 )。 

在 LCF 和 HOL 中 的 策略 算 子 类 似 于 我 们 的 语法 分 析 操 作 符 : 它们 使 用 异常 ， 而 不 是 返回 
一 个 结果 序列 。Isabelle 的 策略 算 子 返回 序列 以 便 允 许 回溯 和 其 他 的 搜索 策略 (Paulson, 1994), 
Hal 的 策略 算 子 基本 是 基于 Isabelle 的 。 

传统 上 策略 算 子 使 用 像 THEN、ORELSE、REPEAT 等 这 样 的 名 字 ， 不 过 这 违背 了 我 们 关 
于 只 有 构造 子 以 大 写字 不 开始 的 约定 。 
练习 10.27 策略 repeat(f-- 有 ) (x) 有 什么 作用 ? 
练习 10.28 depthFirst 真 的 能 进行 深度 优先 搜索 吗 ” 详 细 解 释 这 个 函数 是 怎样 工作 的 。 
练习 10.29 讲述 在 怎样 的 情况 下 -- 或 |8 | 返回 的 序列 会 缺少 一 些 直 觉 上 应 该 存在 的 元 素 。 实 
现 没有 这 种 缺陷 的 新 策略 算 子 。-- 和 |e| 有 什么 相应 的 优点 作为 补偿 ? 
练习 10.30 ”策略 算 子 repeat 和 depthFirst 都 是 以 它们 的 传统 形式 出 现 的 。 它 们 的 效率 对 于 交互 
式 让 明 来 说 足够 了 ， 但 是 用 在 证 明 程序 中 就 不 行 了 。 编 写 更 为 高 效 的 版 本 、 不 要 使 用 --。 
10.16 一 阶 逻辑 的 自动 策略 

使 用 策略 算 子 ， 我 们 将 编写 两 个 简单 的 策略 用 于 自动 证 明 。 给 定 一 个 子 目标 ，depth 试 图 
通过 合 一 、 分 解 某 个 公式 ， 或 展开 量词 来 求解 。 量 词 可 以 无 限 地 不 断 展 开 ， 这 个 策略 可 能 永 
远 也 停 不 下 来 。 

depth 中 的 成 员 本 身 都 可 用 于 交互 式 证 明 ， 特 别 是 当 depth 失 败 时 。 它 们 在 签名 TAC 中 描 
述 为 : 


signature TAC = 
sig 


439 





334 


第 10 全 

val safeSteps: int -> Rule.tactic 

val quant : int -> Rule. tactic 

val step : int -> Rule .tactic 

val depth : Rule.tactic 

val depthit : int -> Rule.tactic 

end; 

这 个 签名 描述 了 五 个 策略 : 


。safeSteps i 对 子 目 标 i 应 用 了 一 系列 非 空 的 “安全 ”规则 。 这 些 规则 是 除了 3:right 和 

V:left 之 外 的 其 他 规则 。 也 不 包括 策略 unify， 因 为 它 会 影响 其 他 目标 。， 

e quan i 展开 了 子 目 标 i 中 的 量词 。 它 有 可 能 既 应 用 3:right 也 应 用 VY:left。 

。depth 通 过 深度 优先 搜索 对 所 有 子 目 标 进行 求解 。 它 使 用 了 safeSteps、unify 和 4quant。 

。step i 尽 可 能 使 用 安全 步骤 对 子 目 标 i; 进 行 求 精 ， 不 行 的 话 则 尝试 合 一 以 及 量词 展开 。 

。depthlt d 通 过 增 量 为 4 的 深度 优先 迭代 深化 来 对 所 有 子 目 标 进行 求解 。 它 使 用 step 1， 它 
是 穷尽 的 ， 但 却 很 慢 。 ; 

结构 Tac (图 10-13) 显示 了 策略 可 以 如 何 简洁 地 表示 证 明 过 程 。sajfe 声 明 列 出 了 必需 的 策 
略 ， 通 过 firstF 组 合 在 一 起 。 只 产生 一 个 子 目 标的 策略 被 放 在 产生 两 个 子 目 标的 策略 之 前 ， 除 
此 以 外 的 顺序 是 任意 的 。 通 过 策略 算 子 -- 和 repeatDeterm 对 sajfe 进 行 重复 ， 就 得 到 了 sajfeSteps。 
可 以 看 出 ，quant 展 开 了 至 少 一 个 量词 ， 也 可 能 展开 两 个 : 如 果 aliL 成 功 ， 则 进一步 尝试 exR。 


structure Tac : TAC = 
struct 
local open Tactical Rule 
in 
val safe = 
firstF [basic, _ 
conjL, disjR，impR，negL，negR，exL，allR，(* 一 个 子 目标 *) 
conjR, disjL, impL, iffL, iffR (* 两 个 子 目 标 *)]; 
fun safeSteps i = safe i -- repeatDeterm (safe i); 
fun quant i = (alll i -- try (exR i)) || exR i; 
val depth = depthFirst final (safeSteps 1 || unify 1 || quant 1); 
fun step i = safeSteps i || (unify i |@| allL i |@| exR i); 
fun depthlt d = depthiter (final, d) (step 1); 
end 
end; 





图 10-13 结构 Tac 


在 两 个 搜索 策略 之 中 ，depth 要 快 一 些 ， 但 不 完全 是 这 样 。 它 使 用 深度 优先 搜索 ， 这 有 进 
入 死胡同 的 可 能 。 另 外 ， 它 尽 可 能 应 用 Rule.unify， 而 不 理会 其 对 于 其 他 目标 的 影响 。 策略 
depthlt 修 正 了 这 些 缺 点 。 注 意 ，step 使 用 的 是 18 | 而 不 是 | | 来 将 Rule.uni 记 与 其 他 策略 组 合 ， 
即使 合 一 成 功 ， 搜 索 也 会 查看 量词 展开 。 两 种 搜索 都 使 用 Rule final (图 10-7) 来 检测 证 明 的 

让 我 们 试 着 将 Tac.depth 用 在 Pelletier (1986) 中 的 一 些 问 题 上 。 这 是 第 39 个 问题 : 

goal "~ (EX x. ALL y. J(x,y) <-> “Jly,y))"; 


> “(EX x. ALL y. I(x, y) <-> “Jy, y)) 
> 1. empty |- “(EX x. ALL y. J{x, y) <-> “d(y, y)) 
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应 用 Tac.depth 可 以 证 明 它 : 


by Tac.depth; 
> “(EX x. ALL y. J(x, y) <-> “J(y, y)) 
> No subgoals left! 


第 40 个 问题 更 为 复杂 。。 


goal "(EX y. ALL x. dJ(y,x) <-> “J(x,x)) --> \ 
~“ (ALL x. EX y. ALL z. J(z,y) <-> ~ J(z,x))"; 
(EX y. ALL x. J(y, x) <-> “T(x, x)) --> 
“(ALL x. EX y. ALL z. J(z, y) <-> “J(2z, x)) 
1. empty 
|- (EX y. ALL x. Sly, x) <-> “J(x, x)) --> 
“(ALL x. EX y. ALL z. J(z, y) <-> “J(z, x)) 


这 个 问题 也 很 容易 就 证 明了 。 
by Tac .depth; 
> (EX y. ALL x. Jy, x) <-> “J(x, x)) --> 


> “(ALL x. EX y. ALL z. J(z, y) <-> “J(z, x)) 
> No subgoals left! 


第 42 个 问题 更 难 一 些 : Tac.depth 不 能 结束 返回 。 


Vv vv vv 


goal "~ (EX y. ALL x. p(x,y) <-> “(EX z. p(x,z) & p(z,x)))"; 
> “(EX y. ALL x. p(x, y) <-> “(EX z. p(x, Z) & p(z, x))) 
> 1. empty 

> 

> ALL x. 
> P(x, y) <-> “(EX z. p(x, Z) & p(z, x))) 


但 是 我 们 的 另 一 个 搜索 策略 成 功 了 : 


by (Tac.depthlt 1); 
> “(EX y. ALL x. p(x, y) <-> “(EX z. p(x, Zz) & p(z, x))) 


> No subgoals left! 
需要 重申 的 是 ， 我 们 的 策略 不 能 和 自动 定理 证 明 机 相 比 。 这 些 策 略 是 通过 应 用 原始 推理 规则 
来 工作 的 ， 而 这 些 规则 的 实现 是 针对 交互 式 应 用 而 设计 的 。 这 些 策略 的 “内 循环 ”( 策 略 saje ) 
以 极其 浪费 的 方式 搜索 连接 词 。 量 词 的 展开 也 缺少 启发 式 的 引导 。 下 面 这 个 看 上 去 简单 的 例 
子 〈 第 43 个 问题 ) 就 不 能 在 合理 的 时 间 内 解决 : 

goal" (ALL x. ALL y. q(x,y) <-> (ALL z.p(z,x) <->p(z,y))) \ 

\ --> (ALL x. (ALL y. q(x,y) <-> qly,x)))"; 
ARRAS SERA ACA ADEASRM. RABBLE. ， 而 抽 
象 类 型 state 杜 绝 了 错误 的 论证 。 


Ol 其 他 定理 证 明 机 。 大 多 数 的 自动 定理 证 明 机 都 是 基于 归结 原理 (Chang 和 Lee， 
1973) 的 。 它 们 证 明 公式 4 的 方法 是 ， 将 -A 转换 成 子 身 形 式 (基于 合 取 范 式 ) HR 
导出 一 个 了 矛盾。 一 个 有 名 的 归结 证 明 机 是 W. McCune 的 Otter。Quaife (1992) 曾经 使 


O 由 于 目标 公式 在 一 行内 写 不 下 ， 转 义 序列 \ …\ 将 字符 串 分 写 在 两 行 。 
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用 Otter 进 行 Peano 算 术 、 几 何 和 集合 论 中 的 证 明 。 另 一 个 令 人 印象 深刻 的 系统 是 
SETHEO (Letz 等 ，1992 ) 。 . 

表 方 法 证 明 机 功能 较 弱 ， 但 是 比 归 结 证 明 机 更 为 自然 ， 因 为 它们 不 需要 将 公式 
转换 为 子 向 形式 。 这 方面 的 例子 包括 HARP (Oppacher 和 Suen，1988) WA E4 AY 
的 leanTAP (Beckert 和 Posegga，1995)， 它 只 是 由 数 行 Prolog 代 码 构 成 。 策 略 depthlt 
有 些 基 于 leanTAP， 但 却 慢 很 多 。 

策略 方案 将 适量 的 自动 化 和 很 大 的 灵活 性 结合 起 来 。 应 用 它 的 系统 并 不 是 针对 
古典 的 一 阶 膛 辑 ， 而 是 其 他 具有 计算 重要 性 的 轴 辑 。LCF 支 持 论 域 理论 的 一 种 还 辑 
(Gordon 等 ，1979; Paulson, 1987), HOLA# X44 £4 6) & Mik ( Gordonse 
Melham，1993 )。Nuprl 支 持 构造 性 类 型 理论 的 一 种 形式 (Constable#, 1986), 
Isabelle 是 一 种 广泛 的 定理 证 明 机 ， 支 持 多 种 不 同 的 逻辑 (Paulson，1994)。 


练习 10.31 画图 说 明 Hal 中 的 结构 、 签 名 和 国 子 ， 以 及 它们 之 间 的 关系 。 
练习 10.32 为 数学 归纳 规则 实现 一 个 策略 ， 其 中 包括 常量 0 和 后 继 函 数 suc: 


THA,opIO/x] 9$,T FA, dlsuc(x)/x] 
THFA,Vx.0 


你 能 预测 将 此 策略 加 入 到 一 个 自动 证 明 过 程 中 会 有 什么 困难 吗 ? 


练习 10.33 声明 一 个 策略 算 子 someGoal , 使 得 当 其 应 用 到 具有 nn 个 子 目 标的 状态 上 时 ， 
someGoal /等 价 于 


限制 条 件 : x 不 能 在 结论 中 自由 出 现 


fifa- Ddi... WFD 
repeat (someGoal Rule.conjR) 对 一 个 证 明 状 态 做 了 些 什么 ? 


练习 10.34 ”我 们 的 证 明 过 程 总 是 处 理子 目标 1。 何 时 选择 其 他 子 目 标 会 更 好 ? 
要 点 小 结 


。 相 继 式 演算 是 一 阶 逻辑 的 一 个 合适 的 证 明 系 统 。 

。 合 一 辅助 进行 有 关 量 词 的 论证 。 

。 合 一 中 的 出 现 检测 对 于 正确 性 是 至 关 重要 的 。 

*。 量 化 变量 可 以 像 和 -演算 中 的 约束 变量 那样 被 处 理 。 

* 推理 规则 可 以 作为 定理 或 证 明 的 抽象 类 型 上 的 操作 。 

。 操作--、| | 和 repeat 在 函数 式 程序 设计 的 各 个 方面 有 着 类 似 的 功能 。 
。 策 略 方案 允许 自动 化 和 交互 式 混合 的 定理 证 明 。 





项 目 建 议 


书 中 练习 的 用 意 在 于 加 深 对 ML 的 理解 ， 以 及 提高 程序 设计 技能 。 然 而 ， 仅 做 这 样 的 练习 
并 不 能 成 为 一 个 程序 员 ， 更 不 用 说 是 软件 工程 师 了 。 项 目 比 大 型 的 练习 涉及 的 内 容 更 多 ， 它 
涉及 更 多 的 程序 设计 。 它 需要 认真 地 筹划 : 背景 知识 学 习 、 需 求 分 析 和 设计 。 完 成 后 的 程序 
还 需要 一 定 的 评测 ， 尽 管 不 可 能 全 面 地 评测 。 

这 里 的 每 个 建议 无 异 于 一 种 提示 ， 但 是 ， 稍 加 修改 就 可 以 得 到 一 个 真正 的 计划 。 首 先 ， 
查阅 后 面 给 出 的 参考 文献 ， 给 出 项 目 描述 ， 包 括 写 出 目的 、 预 计时 间 安 排 ， 以 及 需要 的 资源 
列表 。 其 次 ， 是 书写 详细 的 需求 分 析 ， 详 细 地 列 出 所 有 功能 ， 以 便 他 人 可 以 进行 最 终 的 测试 。 
紧 接 着 描述 基本 设计 ，ML 的 函 子 和 签名 可 以 刻画 主要 组 件 和 它们 的 接口 。 

上 面 勾 勒 的 淮 备 阶段 可 以 由 导师 、 单 个 学 生 或 一 组 学 生 完成 。 这 取决 于 课程 的 目的 ， 它 
有 可 能 只 是 关心 ML 语言 ， 或 者 是 项 目 管理 ， 或 者 是 说 明 软 件 工 程 的 某 些 方法 。 最 后 的 评测 也 
许 同样 可 以 由 导师 、 实 现 者 或 者 另 一 组 学 生来 完成 。 

评测 应 该 考虑 程序 和 目标 的 吻合 程度 。 测 试 可 以 由 需求 分 析 驱 动 。 很 多 项 目 都 不 难 完成 ， 
但 是 很 难 做 到 高 效 。 所 以 评测 除了 考虑 正确 性 之 外 、 还 有 考虑 性 能 ， 评 测 工 具 可 以 定位 性 能 
瓶颈 。 学 生 可 能 需要 发 掘 和 使 用 标准 库 的 模块 一 一 数组 、 机 器 字 操 作 等 一 一 这 是 取得 高 效 的 恰 
RE. 

这 里 建议 的 部 分 项 目 已 经 由 剑桥 的 学 生 完成 了 ， 尽 管 不 一 定 是 用 ML 来 完成 的 。 其 他 的 项 
目 是 因为 有 意思 (至 少 对 我 来 说 ) 才 列 出 来 的 ， 并 且 都 有 一 定 的 难度 。 它 们 都 特别 适合 用 ML 
来 做 ， 实 际 上 所 有 项 目 都 可 以 用 ML 来 完成 ， 除 了 那些 不 需要 安全 性 程序 设计 的 或 坐 人 在 使 用 
其 他 语言 的 系统 中 的 项 目 。 所 以 ， 根 据 需 要 采用 其 他 地 方 的 项 目 建议 。 

无 限 精度 的 整数 运算 可 以 给 出 精确 的 答案 ， 且 不 会 溢出 。( 有些 ML 系 统 默认 地 提供 这 个 
SHAE.) Knuth (1981) 讲述 了 这 个 算法 ， 除 了 除法 以 外 都 很 直接 。 他 还 提出 了 改进 有 理 数 运 
算 的 算法 。 

无 限 精 度 的 实数 运算 可 以 产生 满足 任何 给 定 精度 的 答案 ， 自 动 地 确定 中 间 计 算 的 精度 。 
很 多 努力 都 用 在 寻找 最 高 效 的 实数 表示 方法 上 (Boehm#lCartwright, 1990). Ménissier- 
Morain (1995) 推荐 了 一 种 收敛 的 有 理 级 数 ， 它 形 如 p/B8*。 这 种 模式 中 的 计算 技巧 是 奇妙 的 ， 
虽然 十 分 困难 (Gourdon 和 Salvy，1993)。 你 还 可 以 拓展 5.15 节 的 数值 例子 。 

第 3 章 的 多 项 式 运 算 例 子 可 以 在 几 个 方向 上 扩展 。 你 可 以 提供 更 多 的 运算 ， 允 许多 个 变量 
的 运算 ， 或 者 还 可 以 实现 更 好 的 GCD 算 法 。 见 Davenport 等 (1993) 或 Knuth (1981 ) 。 无 限 精 
度 的 整数 是 必 不 可 少 的 。 

模拟 器 也 很 有 趣 : 你 可 以 使 过 时 的 机 器 和 它 曾 运行 过 的 软件 获得 新 生 。 我 个 人 的 挚爱 是 
DEC PDP-8。 基 本 模式 可 以 寻 址 4096 个 12 位 字 ， 且 带 有 一 个 含 8 个 操作 码 的 指令 集 。 手 册 已 经 
绝版 了 ， 但 是 资料 在 互联 网 上 仍 可 以 查 到 (Jones，1995 )。 诸 如 精确 处 理 中 断 这 样 的 细节 是 
很 环 手 的 。 模 拟 运 行 的 软件 必须 有 一 定 的 速度 ， 至 少 要 赶 上 用 户 的 打字 速度 ! 
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先进 的 重 言 式 检测 器 包括 有 序 二 元 决策 图 (OBDD) 和 Davis-Putnam 证 明 过 程 。OBDD 在 
硬件 和 系统 验证 上 都 有 应 用 ，Bryant (1992) 是 一 个 经 典 的 描述 ， 而 Moore (1994) 可 能 更 为 
适宜 函数 式 程序 设计 。Davis-Putnam 在 多 年 后 重 回 人 们 的 视线 ， 虽 然 早 期 的 书本 上 有 所 介绍 
(Chang 和 Lee、1973), BÆ, 最 近 的 算法 只 在 技术 报告 中 有 所 讲述 (Zhang 和 Stickel， 
1994), 

定理 证 明 机 可 以 有 多 种 方式 建立 在 第 10 章 提供 的 基础 上 。 表 方法 易于 实现 (Beckert 和 
Posegga，1995 )。 模 型 消解 (model elimination) 也 相当 直接 (Stickel，1988a)。Andrews 
(1989) 在 有 关 高 阶 逻 辑 的 背景 下 讲述 了 矩阵 方法 它 也 同样 适合 一 阶 逻辑 。 但 是 最 有 能 力 的 
学 生 应 该 尽力 去 实现 消解 法 (Stickel，1988b ) ， 为 实现 高 性 能 而 做 的 细 化 需要 非常 复杂 的 数 
所 结构 (Butler 和 Overbeek，1994 )。 

考虑 书写 一 个 语法 分 析 器 生成 程序 (parser generator): 简单 的 LR(0)、SLR 或 一 个 
LALR(1) 版 本 ， 并 带 有 成 熟 的 错误 恢复 功能 。 好 的 编译 程序 课本 ， 例 如 Aho 等 (1986), HEA 
了 所 需 的 技术 。 

编译 项 目 总 是 很 受 欢迎 的 。 选 择 一 个 小 的 ML 子 集 ， 并 书写 它 的 解释 器 。SECD 机 器 产生 
传 值 调 用 语义 ,而 图 归 约 则 是 传 需 调用 。Field 和 Harrison (1988) 讲述 了 实现 方法 ， 以 及 类 
型 检测 。 除 非 语 法 非常 简单 ， 否 则 应 该 使 用 一 个 语法 分 析 程 序 生 成 器 ， 例 如 ML-Yacc (Tarditi 
和 Appel，1994 ) 。 

在 尝试 做 一 定 规模 的 项 目 之 前 ， 你 应 该 熟 读 至 少 第 2 ~ 5 章 ， 若 能 连同 第 7 章 和 第 8 章 一 起 
看 ， 就 更 好 了 。 祝 好 运 ! 
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索引 中 的 页 码 为 英文 原 书 页 码 ， 与 书 中 边栏 页 码 一 致 。 


1 function( 国 数 ),314-318 
()constructor (构造 子 ), 32 
* infix (8%), 22, 23, 303 
+ infix (中 缀 ), 22, 23, 303 
- infix (中 缀 ), 22, 23, 303 
/ infix (418%), 23, 303 
: : constructor (构造 子 ), 70-71, 77, 186 
:= infix (H), 314-317 
< infix (H), 26 
<= infix (+128), 27 
<> infix (H), 27, 又 见 equality (相等 ) 
= infix H), 27,97, 又 见 equality (相等 ) 
=> keyword (关键 字 ), 133, 138, 172, 463 
> infix (Pp), 27 
>= infix (448), 27 
@ infix (474%), 78-80, 82, 186 
eliminating (消除 ), 80, 111, 146 
for sequences (序列 上 的 ), 195 
proofs about (相关 的 证 明 ), 226-229 
^ infix CP), 25, 125 
~ function (K 8x), 23 
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AAMPS microprocessor (AAMP5 微 处 理 器 ), 256 

Aasa, Annika, 339 

abs (AR, 24 

abstract types (抽象 类 型 ), 97, 115, 263-269 
examples of (实例 ), 281-283, 327-334 
for proof systems (证 明 系 统 上 的 ), 421 
how to declare (如 何 声明 ), 268 

abstraction over variables (基于 变量 的 抽象 ) 
in A-calculus (入 -演算 中 的 ), 372-374, 377, 379 
in logic OZ $H HJ), 407-409 

abstype declarations (声明 ), 266-269, 281, 284, 460 
repeated (重复 ), 293 

Adams, Stephen, 154 

ALF system (ALF 系 统 ), 13 

all function (函数 ), 184-185, 187 

amortized cost (分 摊 的 开销 ), 262 

andalso keyword (关键 字 ), 27, 43, 462 

Andrews, Peter, 446 

app function (žr), 320 

Appel, Andrew, 10, 15, 102, 351, 371 


append (追加 , 连接 ), 见 @ 
applicative programming (应 用 式 程序 设计 ), 见 functional 
programming (函数 式 程序 设计 ) 

ARITH signature (签名 ), 62-63, 86, 116 

arithmetic in ML (ML 中 的 算术 ), 14, 22-24, 137, 465 
unlimited precision (无 限 精 度 ), 445-446 

Array structure (结构 ), 335 

arrays (数组 ) 
flexible (弹性 ). 154-159, 263, 300 
functional ( 国 数 式 ), 336-339 
mutable (可 变更 ), 154, 335-336 

as keyword (关键 字 ), 132, 133, 156, 463-464 
assignment commands (赋值 命令 ), 见 := 
assignments (BRI, 指派 ), in logic (逻辑 中 的 ), 398 
association lists (关联 表 ), 101-102, 150, 287-288, 336 

atan function (HBL), 24 

AUTOMATH system (AUTOMATH & £), 395 
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backtracking (回调 ), 见 search (搜索 ), depth-first (深度 优先 ) 

Backus, John, 6 注 ,9 

Beckert, B., 443 

before infix (P), 320 

Bevier, William R., 256 

Biagioni, Edoardo, 10 

binary arithmetic (二 元 算术 运算 ), 85-87 

Bind exception (异常 ), 137, 138 

Bin1O structure (结构 ), 350 

Boehm, Hans, 446 

Bool structure (结构 ), 340 

bool type (类 型 ), 26, 127 

boolean values (布尔 值 ), 26-27 

in A-calculus (入 -演算 中 的 ), 385 

Boyer/Moore theorem prover (Boyer/Moore 定 理 证 明 机 )， 
见 NQTHM 

Braun, W., 155 

Bruijin, N. G. de, 395 

Burge, W. H., 371 
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C (C 语 言 ), 15-16, 274 
call-by-name ( 传 名 调用 ), 44-45, 194, 200 注 
in 入 -calculus (入 -演算 中 的 ), 375, 388-392, 395 
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call-by-need ( 传 需 调用 ),8,9,45-48, 140, 又 见 sequences (序列 ) 
call-by-value ( 传 值 调用 ), 39-40, 43, 44, 136, 140 
in A-calculus (入 -演算 中 的 ),375, 389-393 
CAML, 12, 136 
Cardelli, Luca, 67 
Cartwright, Robert, 446 
case expressions (表达 式 ), 133, 137-140, 173, 462 
ceil function (FA Bt). 24 
Char structure (结构 ), 26, 341-342 
char type (类 型 ), 25-26 
Chr exception (异常 ), 137 
chr function (Hx), 25-26, 137 
Church, Alonzo (1t 4), 47, 372 
Church-Rosser Theorem (Church-Rosser 定 理 ), 374 
Cohn, Avra, 256 
combinators (组 合子 ), 180-182 
comments (注释 ), 20, 467 
complex numbers (复数 ), 59-61 
composition, of functions ( 国 数 的 复合 ), Wo 
computer algebra (计算 机 代数 ), 114 
concat function (K$), 74, 82 
for lists ( 表 上 的 ), 81, 187, 190 
for sequences (序列 上 的 ), 437 ` 
concatenation (连接 ) 
of lists ( 表 的 ), 见 @ 
in 入 -calculus (入 -演算 中 的 ), 388, 395 
of sequences (序列 的 ), 195 
of strings CEFR), 25 
conditional expressions (条 件 表 达 式 ), 26-27, 43-44, 462 
and exceptions (及 异常 ), 137, 140 
in A-calculus (入 -演算 中 的 ), 385, 391 
type checking of (之 类 型 检测 ), 64 
conjunctive normal form ( 合 取 范式 ), 167-170, 240-242 
cons (构造 ), 见 : : constructor (构造 子 ) 
Constable, Robert, 443 
constructive type theory (构造 性 类 型 理论 ), 13, 443 
constructors (构造 子 ), 125, 130-132 
for lists ( 表 上 的 ),70 
hiding (隐藏 ), 159, 265-269 
control structures (控制 结构 ), 317-321 
cos function (K$), 24 
Cousineau, Guy, 12 


D 


Damas, Luis, 67 

datatype bindings (数据 类 型 绑 定 ), 267, 461 

datatype declarations (声明 ), 124-130, 460 
recursive (递归 的 ), 142, 165, 192, 194, 233 
repeated (重复 的 ), 128, 293 
with one constructor ( 仅 有 一 个 构造 子 的 ), 159, 261 


datatype specifications (描述 ), 310 
Date structure (结构 ), 15 
Davis-Putnam procedure (Davis-Putnam 过 程 ), 170, 446 
declarations (声明 ), 18-22, 53-56, 460, 又 见 每 一 种 声明 
in a structure (结构 中 的 ), 60 
of modules (模块 的 ),311-312, 457-458 
simultaneous (同时 的 , 联 立 ),S6-58 
declarative programming (声明 式 程序 设计 ), 10 
depth function (E), 143, 189, 232 
dereferencing (引用 解析 ), UL ! 
Dictionary functor (fA -¥-), 281-283 
DICTIONARY signature (签名 ), 149-150, 266, 281, 288 
Dijkstra, Edsger (迪克 斯 特 拉 ), 82,93, 94, 159 
disjoint sum type (不 相交 和 类 型 )，129-130 
disjunctive normal form ( 析 取 范式 ), 170 
distrib function (函数 ), KL conjunctive normal form ( 合 取 范式 ) 
Div exception (异常 ), 137 
div infix (F), 22, 49, 64 
Domain exception (异常 ), 137 
domain theory ( 论 域 理论 ), 215, 216, 233, 247, 443 
drop function ($), 78, 82, 111, 188, 424 
proofs about (相关 的 证 明 ), 251-254 
dropwhile function (fA BQ), 184 


E 


efficiency (效率 ), 9-10, 47 

of recursion (递归 的 ), 42, 76-80 
Eight Queens problem (/\ Jalal gi), 208-211 
Empty exception (异常 ), 138 
environments (环境 ), 21, 39, 62, 378, 393, 418 
eqtype specifications (描述 ), 266, 269, 287-288, 310, 459 
EQUAL constructor (构造 子 ), 127, 281, 289 
equality (相等 ), 96-107 

and abstract types (及 抽象 类 型 ), 97, 267, 268 

and functions (及 6 4%), 97, 234-236 

of references (引用 的 ), 316, 332-334 
Euclid’s Algorithm ( 欧 几 里 得 算法 , RRM), 见 

Greatest Common Divisor (最 大 公 因 子 ) 

evaluation ( 求 值 ), 38-48, 136 

lazy ( 情 性 ), 见 call-by-need ( 传 需 调用 ) 

strict (严格 ), 见 call-by-value ( 传 值 调用 ) 
exception declarations (声明 ), 135-136, 304, 460 
exception specifications (描述 ), 310, 459 
exceptions (异常 ), 134-141, 462 

and commands (及 命令 ), 320-321 

eliminating (消除 ), 151 

type checking of (之 类 型 检测 ), 325 
exists function (函数 ), 184-185, 187 
exn type (类 型 ), 135-139, 141, 177, 321 
exp function (函数 ), 24 
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explode function (tA $), 73 
expressions (表达 式 ), 462-463 
in programming languages (程序 设计 语言 中 的 ), 2-4 


F 


fact function ( 国 数 ), 40-42, 245 
facti function (函数 ), 40-42, 47 
proofs about (相关 的 证 明 ),214, 220-222, 245, 247 
type checking of (之 类 型 检测 ), 64 
factorials (阶乘 ), 40-43, 189, 317-319, 又 见 fact, facti 
in A-calculus (入 -演算 中 的 ), 388-389, 393-395 
Fail exception (异常 ), 138 
false constructor (构造 子 ), 26, 127 
Fibonacci numbers (SE Yk 4324), 49-51, 191, 222-223, 329-330 
filter function (图 数 ), 182-183, 187, 209 
for sequences (序列 上 的 ),.196, 206 
Fitzgerald, J. S., 256 
fixed point property (不 动 点 性 质 ), 389, 392 
Fixedint structure (结构 ), 14 
floor function (图 数 ), 24 
fn expressions (表达 式 ), 172-174, 178, 323, 427-428, 462 
and delayed evaluation (及 延 时 求 值 ), 193, 202, 391 
fold! function ( 国 数 ), 185-187 
proofs about (相关 的 证 明 ), 236-237 
foldr function (图 数 ), 185-187, 190, 211, 409 
proofs about (相关 的 证 明 ), 237 
formule (公式 ), 398 
in ML (用 ML 书写 的 ), 408 
Fortran (Fortranj# =), 2,7,9, 127, 356 
FP (PP 语言 ),9 
from function (函数 ), 193, 199 
Frost, R., 371 
fully-functorial programming (全 国 子 式 程 序 设计 ), 294-299 
fun declarations (声明 ), 19-20, 28-31, 125-127, 460 
of curried functions ( 柯 里 函数 的 ), 174, 182-183 
polymorphic (多 态 的 ), 325 
functional languages ( 国 数 式 语 言 ),9 
functional programming ( 国 数 式 程序 设计 ), 1-11, 38, 58 
and imperative feature (及 命令 式 特性 ), 327-330, 336-339 
application of (之 应 用 ), 10 
functionals ( 算 子 ), 7-8, 179-190, 409, 426-428, 又 见 
tacticals (策略 算 子 ), tactics (策略 ) 
and parsing (及 诸 法 分 析 ), 362-366 
proofs about ( 柑 关 的 证 明 ), 233-237 
functions ( 国 数 ), 6 
as arguments (作为 参数 ), 177-178, 280 
as data (作为 数据 ), 176-177, 191-192 
curried ( 柯 里 的 ), 173-178, 183-185, 209 
declaring (声明 ), 见 fun declarations (声明 ) 
higher-order (高 阶 ), 见 functionals ( 算 子 ) 


iterative (迭代 的 ), 42-44, 49.51, 76-78, 151, 186, 247 
recursive (递归 的 ), 6, 40-44, 48-53, 175, 317 
with multiple arguments/results (具有 多 个 参数 /结果 )， 
29-32, 82, 110 
functor declarations (声明 ), 272, 275-277, 285-289, 312, 458 
functors (F), 271-299, 309, X Wfully-functorial 
programming (全 国 子 式 程序 设计 ) 


G 


Gansner, Emden, 13 

garbage collection (垃圾 收集 ), 5-6, 130, 313 

Gaussian elimination (高 斯 消 元 法 ), 90-92 

General structure (结构 ), 15 

Gerhart, Susan, 256 

Gordon, Michael J. C., 12, 440, 443 

Grant, P. W., 92 

graphs (图 ), 102-107, 278-280 

GREATER constructor (构造 子 ), 127 

Greatest Common Divisor (最 大 公 因 子 ), 3, 10, 48, 53, 248 


for polynomials (多 项 式 上 的 ), 120-121 
Greiner, John, 326 


H 


Hal, 397, 407-443 
Halfant, Matthew, 200 
Hamming problem (#44 [a] R), 330 
handle keyword (关键 字 ), 138, 462 
HARP system (HARP 系 统 ), 443 
Harper, Robert, 326 
Haskell (Haskelli# 3%), 9, 10, 92, 102, 131 注 
hd function (AZt), 74, 82, 138, 176 
for sequences (序列 上 的 ), 192, 327 
heaps (HE), 见 priority queues (优先 队列 ) 
binomial (二 项 式 ), 164 
Hoare, C. A. R. ( 霍 尔 ), 10, 15, 69, 110, 111 
HOL system (HOL 系 统 ), 443 
Holmström, Sören, 336 
Hoogerwoord, R., 159 
HOPE (HOPEE 5), 12 
HTML (HTML 语 言 ), 348-350 
Hudak, Paul, 9 
Huet, Gérard, 12, 421 
Hughes, John, 200, 336 


I 


identifiers (标识 符 ), 21-22, 61, 465-467 

if expressions (表达 式 ), 见 conditional expressions (条 件 
表达 式 ) 

ignore function ( 国 数 ),319 

imperative programming (命令 式 程序 设计 ), 2-5, 79, 108 
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in ML (ML 中 的 ),313-340, 344-356 
ImperativelO functor ( 国 子 ), 350 
implode function (K $t), 73 
include specifications (描述 ), 307-308, 310, 459 
induction (归纳 ) 
on natural numbers (对 于 自然 数 的 ), 216-224, 244-245 
on size (对 于 大 小 的 ), 238-245 
structural (结构 ), 224-233, 245 
well-founded (ft #£), 238, 242-247 
infix declarations (声明 ),460 
infix operators (HR HRE TF), 36-38, 283, 303, 363, 462 
parsing (语法 分 析 ), 364-366, 412-414 
input/output (输入 /输出 ), 8, 340-356 
instances (实例 ) 
of polymorphic types (多 态 类 型 的 ), 65, 176 
of signatures (签名 的 ), 264 
of terms/formule (项 /公式 的 ), 379, 416-420 
Int structure (结构 ), 24, 340 
int type (类 型 ), 22-24 
inter function (Fh BL), 98, 183 
interleave function (si BQO), 195, 202 
Intinf structure (44 #3), 14 
Jo exception (异常 ), 344 
Isabelle system (Isabelle % 4), 246, 421, 440, 443 
it value ( 值 ), 19, 50, 174 
iterates function (FA RL), 196, 198, 331 


K 


keywords, of Standard ML (Standard ML 的 关键 字 ), 21 


L 


Lakatos, Imre, 256 
和 -calculus (入 -演算 ), 182, 372-396 
LAMBDA system (LAMBDA #4), 13 
Landin, Peter, 12 
Launchbury, J., 371 
Lazy ML (EMLi #3). 9 
LCF system (LCF 系 统 ), 11-13, 421, 440, 443 
leanTAP system (leanTAP RH), 443 
left-recursive rules ( 左 递归 规则 ), 361, 381,412 
length function (图 数 ), 76-77, 82, 229 
Leroy, Xavier, 136 
LESS constructor (构造 子 ), 127 
let expressions (表达 式 ), 53-55, 135-137, 300-301, 318 
and polymorphism (及 多 态 性 ), 324 
Letz, R., 443 
lexical analysis ( 启 法 分 析 ), 358-360, 368, 412 
library (J4), xiii, 13-15, 127, 319 
arithmetic and (& 4), 24, 303 
arrays and (数组 ), 335 


characters and (E fF), 26 
functionals and (@ f{-), 187 
input/output and (输入 /输出 ), 350 
lists and (22), 82, 335 
strings and (FFR), 26 
Lisp (Lispig #3), 7, 9.75, 234 
List structure (结构 ), 82, 138 
list type (类 型 ), 70, 144 
ListPair structure (44 #9), 82, 187 
lists ( 表 , 列表 ), 6, 69-122, 141, 336 
doubly linked (双向 链接 ), 见 ring buffers (环形 缓冲 区 ) 
functionals for (之 上 的 算 子 ), 182-188, 195 
in A-calculus (入 -演算 中 的 ), 387-388 
in other languages (其 他 语言 中 的 ),71 
induction on (对 于 它 的 归纳 ), 225 
lazy (惰性 ), 见 sequences (序列 ) 
In function (函数 ), 24 
local declarations (声明 ), 55-56, 300-301, 457, 460 
logic GE #8) 
first-order (一 阶 ), 398-407 
notation (符号 ), 215 
propositional (命题 ), 164-170, 399-400 
LOLITA (LOLITA AS), 11 


M 


Ménissier-Morain, Valérie, 446 
MacQueen, David, 12, 299 
Magnusson, Lena, 13 
making change ( 找 零钱 ), 83-84, 139, 197-198 
map function (fA BL), 182-183, 187-188, 190, 209 
for pairs of lists ( 表 序 偶 上 的 ), 187 
for sequences (序列 上 的 ), 195. 199 
proofs about (相关 的 证 明 ), 235-236 
Match exception (异常 ), 73, 137 
Math structure( 结 构 ), 24, 137 
matrix operations (矩阵 运算 ), 87-93, 183, 275-280 
Mauny, Michel, 136 
max function (图 数 ), 24 
maxi function (4%), 72-73, 238 
mem function (fA), 97-99, 185 
merging (合并 ), 111, 117-118 
meta-variables (元 变量 ), 见 variables, in unification (@— 


中 的 变量 ) 
Miller, Keith, 108 
Miller Steven, 256 - 
Milner, Robin, 11-12, 66, 421 
min function (FB), 24 


Miranda (Mirandaig 3), 9 
ML (ML 语言 ), 1 
and verification (及 验证 ), 214-215 
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as meta-language (作为 元 语言 ), 12-13, 430-431 
compilers for ( 它 的 编译 器 ), xii-xiii 
evolution of (Z 演变 ), xiii, 11-12, 28 
Standard, 10-16 
ML-Yacc (ML 书写 的 编译 器 构造 程序 ), 371 
mod infix (4188), 22, 49 
modules (模块 ), 12, 16, 59-63, 257-312, 又 见 functors (& 
子 ), signatures (签名 ), structures (结构 ) 
reference guide to $ 参考 指南 ), 308-312 
multisets (多 重 集合 ), 251-254, 399 
names (名 字 ), 见 identifiers (N 标 识 符 ) 
natural numbers (自然 数 ), 216-219, 224 
in A-calculus (入 -演算 中 的 ), 386-387, 393-395 
negation normal form (否定 范式 ), 166-167, 238-240 
newmem function ( 国 数 ), 98, 187 
Newton-Raphson method (牛顿 -拉夫 和 森 方 法 ), 见 square 
roots, real (实数 平方 棋 ) 
nil constructor (构造 子 ), 70-71 
Nipkow, Tobias, 371 
nlength function ( 国 数 ), 76, 226-227, 229, 233, 238 
NONE constructor (构造 子 ), 128 
nonfix declarations (声明 ), 38, 460 
Nordström, Bengt, 13 
normal forms (范式 ) 
in A-calculus (入 -演算 中 的 ), 374-375, 392 
not function ( 国 数 ),27, 127 
NQTHM system (NQTHM 系 统 ), 246 
nrev function (函数 ), 79-80, 227-233, 237 
nth function (因数 ), 138, 424 
null function (rA BL), 74. 82 
for sequences (序列 上 的 ), 327 
Nuprl system (Nuprl 系 统 ), 443 


O 


o infix 0} 4%), 180-181, 187, 234-237, 370 

O’Keefe, Richard, 112-113 

occurs check (出 现 欠 测 ), 416-417 

Odersky, M., 102 

Okasaki, Chris, 159, 164 

op keyword (关键 字 ), 37-38, 176-177, 180-181, 186, 465 
open declarations (声明 ), 299-305, 363, 460 

Oppacher, F., 443 

Oppen, Derek, 354 

option type (类 型 ), 128 

ord function ( 国 数 ), 25-26 

ORDER signature (签名 ).280-284, 286 

order type (类 型 ), 127, 281 

ordered binary decision diagrams (有 序 二 又 决策 图 ), 170, 446 
ordered predicate (谓词 ), 249 

orelse keyword (关键 字 ), 27, 43, 462 
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OS structure (结构 ), 15 

Otter system (Otter 系 统 ), 443 

Overflow exception (异常 ), 137 
overloading ( 重 载 ), 23-24, 27, 64, 67, 102 


P 


pairs and tuples ( 序 偶 和 元 组 ), 27-38, 136 
in 入 -calculus (入 -演算 中 的 ), 386 
palindromes (|#]3¢), 207-208, 211 
parameters, in logic (逻辑 中 的 参数 ), 406-407, 416-417, 
428-433, 435 
Park, Stephen, 108 
parsing (语法 分 析 ), 360-372, 381-382, 411-414 
LR, 371 
Pascal (Pascali# 3), 4,7, 108, 175 
pointers in (之 中 的 指针 ), 316, 321, 332 
patterns (模式 ), 130-133, 182-183, 463-464 
and fn notation (及 fn ic 3%), 172 
for datatypes (WHW EA), 125-127 
for lists ( 表 上 的 ), 72-73 
for pairs and tuples ( 序 偶 和 元 组 上 的 ), 28-32 
for records (记录 上 的 ), 34-35, 338 
for trees ( 树 上 的 ), 143 
in val declarations (val 声 明 中 的 ), 31-32, 131-132, 138 
layered (分 层 的 ), 见 as keyword (关键 字 ) 
non-exhaustive (未 穷尽 的 ), 73-75, 83-85, 137 
overlapping ($Æ), 126, 168 
wildcard (通配符 ), 74, 126, 131 
Paulson, Lawrence C., 246, 440, 443 
PDP-8 (PDP-8it BAL), 446 
Pelletier, F., 441 
permutations (排列 ), 95-96, 251 
Peyton Jones, Simon L., 10 
polymorphism (多 态 性 ), 见 types (类 型 ) 
polysomials (多 项 式 ), 114-121. 446 
Posegga, J., 443 
powers (¥#), 48-49, 223-224 
powerset (‘fF tE), 99-100 
pretty printing (美化 打印 ), 351-356, 369-371, 382-384, 414 
Pretty structure (结构 ), 355 
prime numbers (素数 , 质数 ), 94, 199, 219 
PrimiO functor ( 国 子 ), 351 
print function (函数 ), 345, 348 
priority queues (优先 队列 ), 159-164, 281, 283-284, 290-293 
PriorityQueue functor (图 子 ), 284, 296 
product types ( 积 类 型 ), 27-38 
products, Cartesian (第 卡尔 积 , 又 积 ), 100, 187, 203 
Prolog (Prolog 语 言 ), 71, 417, 443 
proof (证 明 ), 399-407 
automated (自动 的 ), 440-443 
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constructive (构造 性 的 ), 219 
states (状态 ), 420-424 
prop type (类 型 ), 165 


Q 


Quaife, A., 443 
quantifiers ( &ia]), 215-216, 403-407, 428-430 
and induction (及 归纳 ), 221-224, 227-228, 245 
queues (队列 ), 206, 258-274 
mutable (可 变更 ), 334 
priority (优先 级 ). 见 priority queues (优先 队列 ) 


R 


raise keyword (关键 字 ), 136, 462 
random numbers (随机 数 ), 108-109, 198-199 
Reade, Chris, 154 
real function (pA Bz), 24 
REAL signature (签名 ), 303 
Real structure (结构 ), 24, 340 
real type (类 型 ), 22-24, 303 
Real32 structure (结构 ), 14 
Real64 structure (结构 ), 14 
rec keyword (关键 字 ), 460 
records (记录 ), 32-35, 338 
selecting fields of (之 域 的 选择 ), 34-35, 464, 467 
recursion (384), WL datatype declarations (声明 ); 
functions ( 国 数 ) 
in A-calculus (入 -演算 中 的 ), 388-395 
infinite (无 穷 ), 363 
mutual (相互 ), 57 
well-founded ( 良 基 ), 245-246 
ref constructor (构造 子 ), 314, 325 
ref type (类 型 ), 314, 321 
references (引用 ), 314-334 
and polymorphism (及 多 态 性 ), 321-326 
cyclic (循环 ),316, 329, 331 
referential transparency (引用 透明 ), 3-4 
reflect function (fA Rt), 144, 189, 230-233 
repeat function (FAL) 
for parsing (语法 分 析 上 的 ), 362-363, 382 
for powers of a function (Xt F AHIR), 188-189, 202 
tactical (策略 算 子 ), 436-437, 439-440 
Reppy, John, 13 
rev function (打数 ), 79-80, 82 
revAppend function (HK$), 80, 227-228 . 
reversing a list (翻转 表 ), 79-80, 186, 324-325, 又 见 mrev， 
rev, revAppend 


ring buffers (环形 缓冲 区 ), 331-334 
S 


scanning (扫描 ), 见 lexical analysis (词法 分 析 ) 


Scheme (Scheme 语 言 ), 9 
Scott, Dana, 13, 375 注 
search (搜索 ), 204-211 
best-first (最 佳 优先 ), 160, 206 
breadth-first (广度 优先 ), 104, 204-208, 210-211 
depth-first (深度 优先 ), 103-105, 204-210, 437-443, 又 
见 making change ( 找 零钱 ) 
iterative deepening (迭代 深化 ), 210-211, 439, 441 
sections (片断 ), 179-181 
Sedgewick, Robert, 105, 108 
semirings ( 半 环 ), 280 
sequences (序列 ), 191-211, 366-367, 423 
and numerical analysis (及 数值 分 析 ), 199-201 
infinite (无 穷 ), 8, 195, 226 
in 入 -calculus (入 -演算 中 的 ), 388, 389, 395 
using references (使 用 引用 ), 327-330 
sequents (相继 式 ), 398-407, 428 
basic (基本 的 ), 399, 423-424 
set operations (集合 运算 ), 98-100, 187 
SETHEO system (SETHEO 系 统 ), 443 
sharing (共享 ) 
constraints (约束 ), 290-294, 306-310, 459 
of references (引用 的 ), 323 
side effects (副作用 ), 3, 323 
sign function ( 国 数 ), 24 
signature constraints (签名 约束 ), 264-266, 269, 275, 299, 311-312 
signature declarations (声明 ), 62-63, 311, 457 
signatures (签名 ), 62-63, 263-271, 285, 309-310, 458 
closed (闭合 的 ), 297-299 
empty ( 空 ), 288 
sin function (图 数 ), 24 
Sisal (Sisal 语 言 ),9 
Size exception (异常 ), 138 
size function (4 80), 25 
for trees ( 树 上 的 ), 143, 189, 232 
Skolem functions (Skolem t %), 417 
Sleator, Daniel, 262 
Smith, M.H., 11 
software development (软件 开发 ), 15-16, 213, 285 
SOME constructor (构造 子 ), 128 
sorting (排序 ), 108-114, 160-162, 177-178 
topological (拓扑 ), 105-107 
verification of (之 验证 ), 249-254 _ 
space (空间 ), 5, 42, 130 
specifications (描述 ) 
executable (可 执行 的 ), 10, 229 
in signatures (签名 中 的 ), 264, 286, 309-310, 459, 又 见 
sharing constrains (共享 约束 ) 
of programs (程序 的 ), 220, 248-249, 251, 255-256 
sqrt function (函数 ), 24 
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square roots (平方 根 ) 
integer (整数 ), 52-53 
real (实数 ), 54-55, 199-201, 又 见 sqrt function (函数 ) 
Srivas, Mandayam, 256 
static binding (静态 绑 定 ), 21 
Stickel, Mark, 170, 446 
str function ( 国 数 ), 26 
StreamlO functor (A-F), 350 
streams, input/output (输入 输出 流 ), 344-347 
String structure (结构 ), 26, 341-342 
String type (类 型 ), 26 
StringCvt structure (结构 ), 341 
strings (字符 串 ), 24-26, 73-74, 184, 340-343, 465-466 
structure declarations (声明 ), 60-63, 311, 457 
structure specifications (描述 ), 283-284, 310, 459 
structures (结构 ), 60-62, 308, 311, 458 
empty (75), 288 
in logic (逻辑 中 的 ), 398 
subs infix (中 缀 ), 99, 115 
Subscript exception (异常 ), 82, 137 
substitution ($$) 
in 入 -calculus (入 -演算 中 的 ), 373-379 
in logic (逻辑 中 的 ), 403-404, 408 
Substring structure (结构 ), 26, 341, 348 
substrings (T EIF, PB), 26, 341-342, 348-350 
Suen, E., 443 
sum of two squares (两 个 平方 之 和 ), 93-94 
Sussman, Gerald, 200 


T 


tacticals (策略 算 子 ), 13, 436-440 
tactics (策略 ), 13, 420-435, 440-443 
take function (FAR). 77, 82, 111, 424 
for sequences (序列 上 的 ), 193, 328 
proofs about (相关 的 证 明 ), 251-254 
takewhile function (FA Bx), 184 
Tarditi, David, 371 
Tarjan, Robert, 262 
tautology checking ( 重 言 式 检测 ), 164-170, 238-242, 354 
terms (项 ) 
in logic GE $H i), 398, 408 
of 入 -calculus (入 -演算 中 的 ), 372-373, 378-379 
theorem proving (定理 证 明 ), 11-13, 397-443, 446 
Time structure (结构 ), 15 
Timer structure (结构 ), 15 
tl function (44%), 75, 82, 138 
for sequences (序列 上 的 ), 192, 327 
Tofte, Mads, 12, 325 
TREE signature (签名 ),295, 297 
Tree structure (结构 ), 148, 297, 304-305 


tree type (类 型 ), 142, 148, 304 
trees ( 树 ), 6, 141-164, 189 
balanced (平衡 ), 143-147, 150-154 
binary search (二 又 搜索 ), 150-154, 176-177, 281~283 
induction on (之 上 的 归纳 ), 229 
traversing (遍历 ), 145-147, 189, 231-233 
true constructor (构造 子 ), 26, 127 
trunc function ( 国 数 ), 24 
Turner, David A.,9,47, 100, 182 
type abbreviations (类 型 缩写 ), 见 type declarations (声明 ) 
in signatures (签名 中 的 ), 307 
type constraints (类 型 约束 ),23-24, 29-30, 35, 324, 334, 462 
type constructors (类 型 构造 子 ), 368 
type declarations (声明 ), 29, 35, 460 
type specifications (描述 ), 269. 309, 459 
type variables (类 型 变量 ), 65-67, 368, 466 
equality (相等 ), 97-99 
types (类 型 ), 63-67, 199, 464 
dynamic (动态 ), 136, 177 
equality (相等 ), 97, 102 
parsing and displaying (语法 分 析 及 显示 ), 367-371 
polymorphic (多 态 ), 128-130, 321-326 
restrictiveness of (之 限制 性 ),71, 124, 325 


U 


unification (4 ---), 405-407, 416-420 
efficient (高 效 的 ), 420 
higher-order (高 阶 ), 421 
tactic for (有 关 的 策略 ), 423-426, 435 
union function (pA RL), 98, 115 
unit type (类 型 ), 32, 129-130, 192, 321 
universe (整体 ), 398 
unzip function ( 国 数 ), 81-82 
Uribe, T., 170 
user interfaces (用 户 界 面 ), 431 


vV 


v-arrays (vy- 数 组 ,版 本 树 数组 ), 336-339 

val declarations (声明 ), 18-19, 31-32, 172-174, 428, 460 
polymorphic (多 态 ), 178, 323-324 

val specifications (描述 ), 309, 459 

validity (47 SHE), 398-399 

variables (变量 ), 21 
in A-calculus (入 -演算 中 的 ), 372-373, 375-377, 379 
in logic (逻辑 中 的 ), 398, 408 
in unification ( 合 一 中 的 ), 405-407, 416-417, 428-430, 434-435 
type (26 4), 见 type variables (类 型 变量 ) 

Vector structure (结构 ), 335 

vectors (向 量 ), 27-32, 37, 89 

verification (验证 ), 13, 213-256 
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limitations of (之 局 限 ), 223, 254-256 Y 
W Y combinator (组 合子 ), 389, 391-392 
Wegner, Peter, 67 Z 


well-founded relations ( 良 基 关系 ), 242-244, 246 
where type qualification (限定 ), 310 

while expressions (表达 式 ), 318, 462 
withtype keyword (关键 字 ), 460 

Word8 structure (结构 ), 14 

Wright, Andrew, 326 


Zhang, Hantao GER), 170 
zip function (函数 ), 81,82 
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预定 义 标识 符 


datatype bool = true | false 


布尔 数据 类 型 
not : bool -> bool 
= <> : "a * "a -> bool 


type int and real 


整数 和 实数 类 型 
一 : num -> num 
+-* : num * num -> num 
abs : num -> num 
/ : real * real -> real 
div mod : int * int -> int 
<><=>= :numtext * numtext -> bool 
real : int -> real 
round : real -> int 
floor : real -> int 
ceil : real -> int 
trunc : real -> int 


type char and string and substring 
字符 、 字 符 串 和 子 串 类 型 


A : string * string -> string 


concat : string list -> string 
explode : string -> char list 
implode : char list -> string 

str : char -> string 

size : string -> int 

substring : string * int * int -> string 
chr : int -> char 

ord : char -> int 


datatype ‘a list = nil | :: of ‘a * ‘a list 


表 的 数据 类 型 
@ : 'a list * 'a list -> ‘a list 
foldl foldr : (‘a*'b->'b) -> 'b -> ‘a list -> 'b 


真 值 


逻辑 非 
相等 测试 


数 


取 负 (num = in! 或 real) 

mE. RE. RA 

绝对 值 

实数 除法 

整数 除法 的 商 和 余数 

关系 (numtext = int、real、char 或 string) 
?转换 到 最 近似 的 实数 

转换 到 最 近似 的 整数 

转换 到 (不 大 于 源 的 ) 最 大 整数 

转换 到 (不 小 于 源 的 ) 最 小 整数 

转换 到 绝对 值 (不 大 于 源 的 符号 相同 的 ) 最 大 整数 


字符 /字符 串 类 型 


连接 两 个 字符 串 
连接 一 个 表 中 的 所 有 字符 串 
转换 到 字符 的 表 

转换 到 字符 串 

转换 到 一 个 字符 的 字符 串 
字符 串 中 的 字符 数 

给 定位 置 和 大 小 的 子 串 

给 定 ASCII 码 的 字符 
字符 的 ASCII 码 


表 


连接 两 个 表 
表 的 递归 





: 'a list -> int 

: (‘a -> 'b) -> ‘a list -> 'b list 
: ‘a list -> ‘a list 

: 'a list ->'a 

: 'a list -> ‘a list 


: 'a list -> bool 


: ('b->'c) * (‘'a->'b) -> 'a -> 'c 


datatype 'a option = NONE | SOME of a 


可 选 数据 类 型 
isSome : 'a option -> bool 
valOf : ‘a option -> 'a 
getOpt : 'a option * 'a -> 'a 


datatype order = LESS | EQUAL | GREATER 


序 的 数据 类 型 


type unit 


单元 类 型 


app 
ignore 


print 


type ‘a ref 


: (a -> unit) -> 'a list -> unit 
: 'a -> list 


: string -> unit 


引用 类 型 


ref 


before 


type ‘a array 


: 'a ref -> 'a 
: 'a -> 'a ref 
: 'a ref * 'a -> unit 


: 'a * 'b -> 'a 


数组 类 型 


type ‘a vector 


向 量 类 型 


vector 


type exn 


: 'a list -> 'a vector 


异常 类 型 


exnName 


exnMessage 


异常 
Bind 


: exn -> string 


: exn -> string 


表 的 长 度 

对 表 的 成 员 应 用 一 个 函数 
表 的 翻转 

表 首 

表 尾 

空 表 的 测试 


函数 的 复合 
可 选 值 


测试 SOME 
SOMFE 的 逆 操 作 
从 SOME 中 提取 


序 的 关系 


空 元 组 的 类 型 


对 表 的 成 员 应 用 一 个 命令 
转换 到 单元 类 型 
打印 到 终端 


引用 
引用 的 内 容 
引用 的 创建 


引用 的 赋值 
第 一 个 操作 数 


可 变更 数组 


不 可 变数 组 


转换 到 向 量 
异常 的 类 型 


异常 的 名 字 
异常 的 信息 


在 val 声 明 中 无 匹配 


SAR AR IRA 
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Chr 字符 编码 溢出 


Div 除数 为 零 

Domain Math eh Bx 2 Bh FIR 

Fail of string 一 般 错 误 

Match 在 fun、case 等 中 没有 匹配 的 模式 
Option 需要 SOME 

Overflow 算术 运算 溢出 

Size 负数 或 过 大 的 大 小 

Subscript 索引 值 (下 标 ) 洲 出 


中 绎 操作 符 的 优先 级 ( 除 : : 和 @ 之 外 都 是 左 结合 的 ) 


7 / * div mod 

6 +- ^ 

5 : @ 

4 = <> < > <= >= 
3 := 0 

0 before 


